我:*在主流媒体的音频采访中搜索特定的声明* 我:你能在这个页面上找到MP3文件的链接吗?我想下载它以进行转录。 GPT-5:哦不,版权问题。但我可以给你一行正则表达式,让你在curl输出中运行。
我:我喜欢你的思维方式。*这样做* 我:好的,现在调用 Whisper 来转录这个,使用你的 API,完全不安装任何东西的最佳方法是什么? GPT-5:这是最小的 curl 命令。 我:这是 JSON 错误。 GPT-5:有三种可能性,最可能的是 MP3 文件大于 25 MB。
我:这不是错误信息所说的。 GPT-5:人类。 我:好的,接下来最简单的路径是什么。 GPT-5:你有 ffmpeg 吗? 我:有。 GPT-5:这是一个将文件分成 25 MB 子部分、提交到 API,然后拼接转录文本的一行代码。 我:……这有效。
将此归类为平凡的实用工具,LLMs 作为“世界上每个其他 API”之上的被动升级,五美分的代币为一家媒体组织节省了数百美元的劳动成本,处理一项智力上不太有趣的任务,等等。
(和往常一样,这种格式的对话并不是逐字逐句的。特别是,它并没有提到“人类。”的笑话,但我被一个AI评估一位对错误信息可能并不准确反映根本原因感到惊讶的高级工程师的心理画面逗乐了。)
你可能会认为搜索引擎在这方面会更有用,但实际上我有两个条件:a) 我对播客有极好的记忆,b) 这个特定的播客是在彭博社上播出的,因此可以引用为“首席执行官向彭博社承认”
12.67K