Eu: *procurando por uma afirmação específica em uma entrevista em áudio da mídia convencional* Eu: Você pode encontrar o link para o arquivo MP3 nesta página para que eu possa baixá-lo para transcrever? GPT-5: Oh não, preocupações com direitos autorais. Mas eu poderia lhe dar uma expressão regular de uma linha para executar na saída curl.
Eu: Eu gosto do jeito que você pensa. *faz isso* Eu: OK, agora qual é a melhor maneira de invocar o Whisper para transcrever isso, usando sua API, não instalando absolutamente nada? GPT-5: Aqui está o comando curl mínimo. Eu: Aqui está o erro JSON. GPT-5: Três possibilidades, provavelmente o arquivo MP3 tem >25 MB.
Eu: Não é isso que a mensagem de erro diz. GPT-5: Humanos. Eu: OK, qual é o caminho mais fácil a seguir. GPT-5: Você tem ffmeg disponível? Eu: Sim. GPT-5: Aqui está uma linha que se divide em subpartes de 25 MB, envia para a API e, em seguida, une as transcrições. Me:... Isso funcionou.
Arquive isso em utilidade mundana, LLMs atuando como uma atualização passiva em cima de "todas as outras APIs do mundo", cinco centavos de tokens que economizam várias centenas de dólares de trabalho em uma tarefa intelectualmente desinteressante, etc.
(Como sempre, o diálogo neste formato não é literal. Em particular, não fez a piada "Humanos", mas me diverti com a imagem mental de uma IA avaliando um engenheiro sênior que ficou surpreso que as mensagens de erro podem não refletir com precisão as causas raiz.)
Você pensaria que os mecanismos de pesquisa seriam muito mais úteis para isso do que são, mas na verdade é uma carga que a) tenho uma memória extremamente boa para podcasts e b) este podcast em particular estava na Bloomberg e, portanto, pode ser citado como "O CEO admitiu à Bloomberg que"
14,94K