MCP-Universe benchmark toont aan dat GPT-5 meer dan de helft van de echte orkestratietaken niet haalt.
3,53K