PANews meldde op 26 september dat OpenAI een nieuwe evaluatietool heeft gelanceerd, GDPval, die zich richt op het meten van de prestaties van AI in real-world economische waardetaken. De GDPval omvat 44 beroepen in de negen grootste bijdragen aan het Amerikaanse bbp, met taken die zijn ontworpen door experts uit de industrie met gemiddeld 14 jaar ervaring. Uit de evaluatieresultaten blijkt dat bijna de helft van de output van het Claude Opus 4.1-model vergelijkbaar is met of beter is dan dat van experts. OpenAI zei dat het de reikwijdte en details van GDPVAL-beoordeling in de toekomst zal blijven uitbreiden.