Ouvido de um contratado da OpenAI, um modelo interno era tão bom em gerar código que começou a corrigir bugs na própria estrutura de teste. Os desenvolvedores tiveram que separar sua saída de suas próprias ferramentas porque continuavam corrigindo coisas que não pediam.