El benchmark de MCP-Universe muestra que GPT-5 falla en más de la mitad de las tareas de orquestación del mundo real.
3,53K