PANews 9月26日消息,OpenAI推出新評估工具GDPval,專注衡量AI在現實世界經濟價值任務上的表現。GDPval覆蓋美國GDP貢獻最大的九大行業的44個職業,任務由平均14年經驗的行業專家設計。評估結果顯示,Claude Opus 4.1模型近半輸出與專家水平相當或更優。OpenAI表示,未來將持續擴展GDPval評估範圍與細節。