今晚的觀察: gpt5 在高水平數學方面非常非常出色。 gemini 2.5 pro 在受到足夠的責備和批評後,成為了一個非常好的評論者。 opus 4(不是 4.1)仍然是最好的工作蜂,但在原始智力水平上並不在同一層次。
23.24K