Já: *hledám konkrétní tvrzení v audio rozhovoru pro mainstreamová média* Já: Najdete na této stránce odkaz na MP3 soubor, abych si ho mohl stáhnout a přepsat? GPT-5: Ale ne, obavy o autorská práva. Ale mohl bych vám dát jednořádkový regulární výraz, který by běžel proti výstupu curl.
Já: Líbí se mi, jak přemýšlíte. *dělá to* Já: Dobře, jaký je nejlepší způsob, jak vyvolat Whisper, aby to přepsal pomocí vašeho API, aniž byste nainstalovali vůbec nic? GPT-5: Zde je minimální příkaz curl. Já: Tady je chyba JSON. GPT-5: Tři možnosti, s největší pravděpodobností má soubor MP3 velikost >25 MB.
Já: To není to, co ta chybová zpráva říká. GPT-5: Lidé. Já: OK, jaká je nejjednodušší cesta vpřed. GPT-5: Máte k dispozici ffmeg? Já: Jo. GPT-5: Zde je jednořádkový text, který se rozdělí na 25 MB dílčích částí, odešle se do API a poté spojí přepisy. Mě:... To fungovalo.
Založte to pod všední utilitu, LLM fungující jako pasivní upgrade nad "každé jiné API na světě", pět centů tokenů, které ušetří mediální organizaci několik set dolarů práce na intelektuálně nezajímavém úkolu, atd.
(Jako vždy, dialogy v tomto formátu nejsou doslovné. Konkrétně to nedělalo vtip o "lidech", ale pobavil mě mentální obraz umělé inteligence, která hodnotila staršího inženýra, který byl překvapen, že chybové zprávy nemusí přesně odrážet hlavní příčiny.)
Mysleli byste si, že vyhledávače by pro to byly mnohem užitečnější, než jsou, ale ve skutečnosti je to zátěž, že a) mám extrémně dobrou paměť na podcasty a b) tento konkrétní podcast byl na Bloombergu a proto může být citován jako "Generální ředitel přiznal Bloombergu, že"
12,67K