Benchmark-ul MCP-Universe arată că GPT-5 eșuează mai mult de jumătate din sarcinile de orchestrare din lumea reală
3,53K