我:*在主流媒體的音頻訪談中搜索特定的聲明* 我:你能在這個頁面上找到MP3文件的鏈接,讓我可以下載它來轉錄嗎? GPT-5:哦不,版權問題。但我可以給你一行正則表達式,讓你可以在curl輸出中運行。
我:我喜歡你的思維方式。*這樣做* 我:好吧,現在用你的 API 調用 Whisper 進行轉錄的最佳方法是什麼,完全不安裝任何東西? GPT-5:這是最簡單的 curl 命令。 我:這是 JSON 錯誤。 GPT-5:有三種可能性,最有可能的是 MP3 文件大於 25 MB。
我:錯誤訊息並不是這樣說的。 GPT-5:人類。 我:好吧,最簡單的前進路徑是什麼? GPT-5:你有 ffmpeg 嗎? 我:有。 GPT-5:這是一行程式碼,可以將其分割成 25 MB 的子部分,提交到 API,然後將轉錄結果拼接在一起。 我:……這有效。
將這歸類為平凡的實用性,LLM作為“世界上每個其他API”之上的被動升級,五美分的代幣為一家媒體機構節省了幾百美元的勞動成本,這是一項智力上不太有趣的任務,等等。
(一如往常,這種格式的對話並非逐字記錄。特別是,它並沒有提到“人類。”的笑話,但我對一個 AI 評估一位對錯誤信息可能不準確反映根本原因感到驚訝的資深工程師的心理畫面感到 amused。)
你會認為搜尋引擎在這方面會更有用,但實際上是因為 a) 我對播客有極好的記憶,b) 這個特定的播客是在 Bloomberg 上,因此可以引用為「這位 CEO 向 Bloomberg 承認」
13.87K