Hørt fra en entreprenør hos OpenAI, var en intern modell så god til å generere kode at den begynte å fikse feil i selve testrammeverket. Utviklere måtte skille utdataene fra sine egne verktøy fordi den fortsatte å lappe ting de ikke ba den om.