PANews ha riferito il 26 settembre che OpenAI ha lanciato un nuovo strumento di valutazione, GDPval, incentrato sulla misurazione delle prestazioni dell'IA nelle attività di valore economico del mondo reale. Il GDPval copre 44 occupazioni nei nove maggiori contributori al PIL degli Stati Uniti, con attività progettate da esperti del settore con una media di 14 anni di esperienza. I risultati della valutazione mostrano che quasi la metà della produzione del modello Claude Opus 4.1 è paragonabile o migliore di quella degli esperti. OpenAI ha dichiarato che continuerà ad espandere la portata e i dettagli della valutazione GDPVAL in futuro.