Grok 4は、フロンティアモデルの中でもARC-AGI-2で最先端です。 Grok 4 の 15.9% 対 GPT-5 の 9.9%。
ARC Prize
ARC Prize8月8日 01:29
ARC-AGI セミプライベート評価上の GPT-5 GPT-5 * ARC-AGI-1: 65.7%、0.51 ドル/タスク * ARC-AGI-2: 9.9%、0.73 ドル/タスク GPT-5ミニ * ARC-AGI-1: 54.3%、0.12 ドル/タスク * ARC-AGI-2: 4.4%、0.20 ドル/タスク GPT-5 ナノ * ARC-AGI-1: 16.5%、0.03 ドル/タスク * ARC-AGI-2: 2.5%、0.03 ドル/タスク
810