يظهر معيار MCP-Universe أن GPT-5 يفشل في أكثر من نصف مهام التنسيق في العالم الحقيقي
‏‎3.53‏K