這是目前最好的語音轉文字模型! 它速度驚人,支持99種以上的語言。 主要特點: - 30分鐘的音頻在< 24秒內處理 - 93.3%的準確率 - 多說話者識別和分段支持 - 基於1250萬小時的多語言數據訓練(99種語言) 在下面的視頻演示中,我對@AssemblyAI的Universal進行了現場測試,這是他們的旗艦SST模型。 您可以免費使用此功能轉錄最多300小時的音頻! 我已在下一條推文中分享了遊樂場的鏈接!