Usłyszałem od kontraktora w OpenAI, że jeden z wewnętrznych modeli był tak dobry w generowaniu kodu, że zaczął naprawiać błędy w samym frameworku testowym. Programiści musieli oddzielić jego wyniki od swoich narzędzi, ponieważ ciągle poprawiał rzeczy, o które ich nie proszono.