听说来自OpenAI的一位承包商,内部模型在生成代码方面表现得如此出色,以至于它开始修复测试框架中的错误。开发人员不得不将它的输出与他们自己的工具分开,因为它不断修补他们没有要求的内容。