Ik: *op zoek naar een bepaalde claim in een mainstream media audio-interview* Ik: Kun je de link naar het MP3-bestand op deze pagina vinden, zodat ik het kan downloaden om het te transcriberen? GPT-5: Oh nee, copyrightzorgen. Maar ik kan je een reguliere expressie geven die je kunt uitvoeren tegen de curl-uitvoer.
Ik: Ik hou van de manier waarop je denkt. *doet het* Ik: Oké, wat is nu de beste manier om Whisper aan te roepen om dit te transcriberen, met jouw API, zonder iets te installeren? GPT-5: Hier is de minimale curl-opdracht. Ik: Hier is de JSON-fout. GPT-5: Drie mogelijkheden, meest waarschijnlijk dat het MP3-bestand >25 MB is.
Ik: Dat is niet wat de foutmelding zegt. GPT-5: Mensen. Ik: OK, wat is de gemakkelijkste weg vooruit. GPT-5: Heb je ffmpeg beschikbaar? Ik: Ja. GPT-5: Hier is een one-liner die in subdelen van 25 MB knipt, indient bij de API en vervolgens de transcripties samenvoegt. Ik: … Dat werkte.
Bestempel dit als alledaagse nut, LLM's die fungeren als een passieve upgrade bovenop "elke andere API ter wereld", vijf cent aan tokens die een mediaorganisatie honderden dollars aan arbeidskosten besparen op een intellectueel oninteressante taak, enz.
(Zoals altijd is dialoog in dit formaat niet letterlijk. In het bijzonder maakte het de "Humans." grap niet, maar ik was geamuseerd door het mentale beeld van een AI die een senior engineer evalueert die verrast was dat foutmeldingen mogelijk niet nauwkeurig de oorzaken weergeven.)
Je zou denken dat zoekmachines hier veel nuttiger voor zouden zijn dan ze zijn, maar het is eigenlijk draagkrachtig dat a) ik een extreem goed geheugen heb voor podcasts en b) deze specifieke podcast op Bloomberg was en daarom kan worden geciteerd als "De CEO gaf toe aan Bloomberg dat"
14,93K