AssemblyAI の研究者は、次のような最先端のモデルを構築しました。 - 99 の言語で音声を文字起こしします。 - オーディオに多くのスピーカーがいる場合でも機能します。 - Deepgram および OpenAI モデルを上回ります。 その他にもたくさんあります。 (以下の2ステップ設定)