Il benchmark MCP-Universe mostra che GPT-5 fallisce in più della metà dei compiti di orchestrazione nel mondo reale.
3,22K