Ich: *suche nach einem bestimmten Anspruch in einem Audiointerview der Mainstream-Medien* Ich: Kannst du den Link zur MP3-Datei auf dieser Seite finden, damit ich sie herunterladen und transkribieren kann? GPT-5: Oh nein, urheberrechtliche Bedenken. Aber ich könnte dir einen regulären Ausdruck in einer Zeile geben, den du gegen die curl-Ausgabe ausführen kannst.
Ich: Ich mag, wie du denkst. *macht es* Ich: OK, was ist jetzt der beste Weg, um Whisper über deine API zu verwenden, ohne irgendetwas zu installieren? GPT-5: Hier ist der minimale curl-Befehl. Ich: Hier ist der JSON-Fehler. GPT-5: Drei Möglichkeiten, am wahrscheinlichsten ist, dass die MP3-Datei >25 MB ist.
Ich: Das steht nicht in der Fehlermeldung. GPT-5: Menschen. Ich: OK, was ist der einfachste Weg nach vorne. GPT-5: Hast du ffmpeg zur Verfügung? Ich: Ja. GPT-5: Hier ist ein Einzeiler, der in 25 MB große Teile aufteilt, an die API sendet und dann die Transkripte zusammenfügt. Ich: … Das hat funktioniert.
Ordnen Sie dies unter alltäglicher Nützlichkeit ein, LLMs, die als passive Verbesserung über "jede andere API der Welt" fungieren, fünf Cent an Tokens, die einer Medienorganisation mehrere hundert Dollar an Arbeitskosten bei einer intellektuell uninteressanten Aufgabe sparen, usw.
(Wie immer ist der Dialog in diesem Format nicht wörtlich. Insbesondere wurde der Witz über "Menschen" nicht gemacht, aber ich war amüsiert von dem mentalen Bild eines KI, die einen leitenden Ingenieur bewertet, der überrascht war, dass Fehlermeldungen möglicherweise nicht genau die Ursachen widerspiegeln.)
Man könnte denken, dass Suchmaschinen dafür viel nützlicher wären als sie es tatsächlich sind, aber es ist tatsächlich belastend, dass a) ich ein extrem gutes Gedächtnis für Podcasts habe und b) dieser spezielle Podcast auf Bloomberg war und daher als "Der CEO gab gegenüber Bloomberg zu, dass" zitiert werden kann.
14,94K