Слышу несколько шепота от птиц, что внутренние оценки имеют gpt5 немного выше grok 4 Heavy. Однако оценки говорят только об одной стороне модели, поэтому любопытно посмотреть, получим ли мы какие-либо серьезные агентные или другие улучшения.
277,28K