Der MCP-Universe-Benchmark zeigt, dass GPT-5 mehr als die Hälfte der realen Orchestrierungsaufgaben nicht besteht.
3,22K