Ja: *szukam konkretnego roszczenia w wywiadzie audio w mediach mainstreamowych* Ja: Czy możesz znaleźć link do pliku MP3 na tej stronie, żebym mógł go pobrać do transkrypcji? GPT-5: O nie, obawy dotyczące praw autorskich. Ale mogę dać ci jedną linię wyrażenia regularnego do uruchomienia na wyjściu curl.
Ja: Podoba mi się, jak myślisz. *robi to* Ja: OK, a jaki jest najlepszy sposób, aby wywołać Whisper, aby to transkrybować, używając twojego API, instalując absolutnie nic? GPT-5: Oto minimalna komenda curl. Ja: Oto błąd JSON. GPT-5: Trzy możliwości, najprawdopodobniej plik MP3 ma >25 MB.
Ja: To nie to, co mówi komunikat o błędzie. GPT-5: Ludzie. Ja: OK, jaka jest najłatwiejsza droga naprzód. GPT-5: Czy masz dostępne ffmpeg? Ja: Tak. GPT-5: Oto jedna linia, która dzieli na części po 25 MB, przesyła do API, a następnie łączy transkrypcje. Ja: … To zadziałało.
Zgłoś to jako zwykłe narzędzie, LLM-y działające jako pasywna aktualizacja na „wszystkie inne API na świecie”, pięć centów tokenów, które oszczędzają organizacji medialnej kilka setek dolarów pracy nad intelektualnie nieciekawym zadaniem, itd.
(Jak zawsze, dialog w tym formacie nie jest dosłowny. W szczególności nie padł żart o „Ludziach.”, ale byłem rozbawiony mentalnym obrazem AI oceniającego starszego inżyniera, który był zaskoczony, że komunikaty o błędach mogą nie odzwierciedlać dokładnie przyczyn źródłowych.)
Można by pomyśleć, że wyszukiwarki byłyby w tym znacznie bardziej przydatne, niż są, ale to w rzeczywistości zależy od tego, że a) mam niezwykle dobrą pamięć do podcastów i b) ten konkretny podcast był na Bloomberg, więc można go zacytować jako „CEO przyznał się Bloombergowi, że”
17,35K