这是目前最好的语音转文本模型! 它速度极快,支持99种语言。 主要特点: - 30分钟的音频处理时间少于24秒 - 93.3%的准确率 - 多说话者识别和分离支持 - 基于1250万小时的多语言数据训练(99种语言) 在下面的视频演示中,我对@AssemblyAI的Universal进行了现场测试,这是他们的旗舰SST模型。 您可以免费转录多达300小时的音频! 我在下一条推文中分享了游乐场的链接!