GPT-5 рекламировался как уменьшающий галлюцинации, и, похоже, он это дает. 99.5 -> 99.9 это на 80% меньше ошибок. Я не знаю, почему люди не делают из этого большую проблему. Галлюцинации являются одной из самых больших проблем LLM, и некоторые считали их неразрешимыми.
OpenRouter
OpenRouter15 авг., 00:29
After one week, GPT-5 has topped our proprietary model charts for tool calling accuracy🥇 In second is Claude 4.1 Opus, at 99.5% Details 👇
135,55K