Các nhà nghiên cứu từ AssemblyAI đã xây dựng một mô hình tiên tiến nhất mà: - chuyển đổi lời nói sang văn bản ở 99 ngôn ngữ. - hoạt động ngay cả khi âm thanh có nhiều người nói. - vượt trội hơn các mô hình của Deepgram và OpenAI. Và còn nhiều hơn thế nữa. (Thiết lập 2 bước bên dưới)