Společnost PANews 26. září uvedla, že OpenAI spustila nový hodnotící nástroj GDPval, který se zaměřuje na měření výkonnosti umělé inteligence v reálných úlohách ekonomické hodnoty. GDPval pokrývá 44 povolání v devíti největších přispěvatelích k HDP USA, přičemž úkoly jsou navrženy odborníky z oboru s průměrnou 14letou praxí. Z výsledků hodnocení vyplývá, že téměř polovina výstupů modelu Claude Opus 4.1 je srovnatelná nebo lepší než u expertů. Společnost OpenAI uvedla, že v budoucnu bude i nadále rozšiřovat rozsah a podrobnosti hodnocení GDPVAL.