これは、最高かつ最速の音声テキスト変換モデルです。 - 93.3%の精度 - 30分間の音声を<24秒で処理 - 複数の話者の識別とダイアライゼーションのサポート - 1,250万時間の多言語データ(99言語)でトレーニング済み これがいいと思います👇