Io: *cercando un'affermazione particolare in un'intervista audio di un media mainstream* Io: Puoi trovare il link al file MP3 su questa pagina così posso scaricarlo per trascriverlo? GPT-5: Oh no, preoccupazioni relative al copyright. Ma potrei darti un'espressione regolare di una riga da eseguire sull'output di curl.
Io: Mi piace il modo in cui pensi. *lo fa* Io: OK, qual è il modo migliore per invocare Whisper per trascrivere questo, usando la tua API, senza installare assolutamente nulla? GPT-5: Ecco il comando curl minimo. Io: Ecco l'errore JSON. GPT-5: Tre possibilità, è più probabile che il file MP3 sia >25 MB.
Io: Non è quello che dice il messaggio di errore. GPT-5: Umani. Io: OK, qual è il percorso più semplice da seguire. GPT-5: Hai ffmpeg disponibile? Io: Sì. GPT-5: Ecco una riga di comando che suddivide in parti da 25 MB, invia all'API e poi unisce i trascritti. Io: … Ha funzionato.
Archivia questo sotto utilità banale, LLM che agiscono come un aggiornamento passivo su "ogni altra API nel mondo", cinque centesimi di token che fanno risparmiare a un'organizzazione mediatica diverse centinaia di dollari di lavoro su un compito intellettualmente poco interessante, ecc.
(Come sempre, il dialogo in questo formato non è letterale. In particolare, non ha fatto la battuta "Umani.", ma sono stato divertito dall'immagine mentale di un'AI che valuta un ingegnere senior che era sorpreso che i messaggi di errore potessero non riflettere accuratamente le cause principali.)
Si potrebbe pensare che i motori di ricerca sarebbero molto più utili per questo di quanto non siano, ma in realtà è fondamentale che a) io abbia una memoria estremamente buona per i podcast e b) questo particolare podcast fosse su Bloomberg e quindi possa essere citato come "Il CEO ha ammesso a Bloomberg che"
13,87K