26 вересня PANews повідомив, що OpenAI запустила новий інструмент оцінки GDPval, зосереджений на вимірюванні продуктивності ШІ в реальних завданнях економічної цінності. GDPval охоплює 44 професії в дев'яти найбільших внесках у ВВП США, із завданнями, розробленими галузевими експертами з середнім досвідом роботи 14 років. Результати оцінки показують, що майже половина продукції моделі Claude Opus 4.1 порівнянна або краща за продуктивність експертів. OpenAI заявила, що в майбутньому продовжить розширювати сферу та деталі оцінки GDPVAL.