这是目前最好的、最快的语音转文本模型! - 93.3% 的准确率 - 30 分钟的音频在 < 24 秒内处理完成 - 支持多说话者识别和分离 - 在 1250 万小时的多语言数据(99 种语言)上训练 快来看看👇