Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
BREAKING: xAI mengumumkan Grok 4
"Itu bisa bernalar pada tingkat manusia super!"
Inilah semua yang perlu Anda ketahui:

Elon mengklaim bahwa Grok 4 lebih pintar dari hampir semua mahasiswa pascasarjana di semua disiplin ilmu secara bersamaan.
Pelatihan 100x lebih banyak daripada Grok 2.
Komputasi 10x lebih banyak pada RL daripada model mana pun di luar sana.

Kinerja pada Ujian Terakhir Kemanusiaan
Elon: "Grok 4 adalah level pascasarjana dalam segala hal!"

Penskalaan HLE - Pelatihan
Lebih banyak komputasi, kecerdasan yang lebih tinggi.
(tanpa alat)

Dengan panggilan alat asli, Grok 4 meningkatkan kinerja secara signifikan.
Lihatlah lekukan itu!
Penting untuk memberi AI alat yang tepat. Penskalaannya jelas. Gila!

Sinyal yang andal adalah kunci untuk membuat RL bekerja.
Masih ada tantangan data.
Elon: "Tes penalaran utama adalah AI yang beroperasi dalam kenyataan."
Menskalakan komputasi waktu pengujian
Lebih dari 50% subset hanya teks dari masalah HLE terpecahkan!
Kurva terus menjadi lebih konyol.

Grok 4 adalah versi agen tunggal.
Grok 4 Heavy adalah versi multi-agen.
Sistem multi-agen bukanlah lelucon!

Grok 4 digunakan untuk memprediksi juara Seri Dunia untuk tahun ini.
Ini adalah tugas-tugas menarik yang perlu diuji oleh model penalaran. Tentang peristiwa dunia nyata yang sebenarnya.

Visualisasi dua lubang hitam yang bertabrakan.
Grok 4 menggunakan semua jenis referensi seperti makalah, membaca PDF, alasan tentang detail simulasi, dan data apa yang akan digunakan.

Contoh menunjukkan ringkasan garis waktu/perubahan dan pengumuman skor di HLE.
Itu cukup keren!

Performa multi-modal
Performa Grok 4 Heavy lebih tinggi dari Grok 4, tetapi perlu ditingkatkan lebih lanjut. Itu salah satu kelemahan, menurut tim.

Performa pada tolok ukur Penalaran.
Skor sempurna di AIME25!
Lompatan itu gila dibandingkan dengan model terbaik terakhir pada tugas-tugas ini.

Di mana menguji model.
Tersedia sebagai tingkat SuperGrok Heavy.
$30/juta untuk Super Grok
$300/m untuk SuperGrok Heavy.

Pembaruan suara juga disertakan!
Grok terasa lebih tajam dan dirancang agar lebih alami.
- 2x lebih cepat
- 5 suara
- 10x detik pengguna harian

BUSUR-AGI
Grok 4 pada ARC-AGI v2 (subset pribadi)
Ini menembus penghalang 10% (15,9%).
2x tempat kedua, yaitu model Claude Opus 4.

Grok 4 di Bangku Penjual Otomatis
Grok 4 mendapat tempat #1.
Dua kali lipat kekayaan bersih Claude Opus 4.

Model Grok 4 tersedia melalui API xAI.
Jendela konteks 256K.
Pencarian data waktu nyata.

Grok 4 untuk Game!
Pemahaman video adalah area yang sedang ditingkatkan tim, sehingga akan menjadi lebih baik.

Apa selanjutnya?
Cerdas dan cepat akan menjadi fokus.
Model pengkodean juga menjadi fokus besar.
Agen multi-moda yang lebih mumpuni juga akan datang.
Model pembuatan video juga ada di cakrawala.

@elonmusk dan tim @xai benar-benar memasak dengan Grok 4. Semua sangat menarik untuk melihat fokus pada AI untuk realitas, mencari kebenaran, dan membuka agen multi-moda selanjutnya.
Saya mulai bereksperimen dengan Grok 4 dan saya sudah menemukan beberapa hal menarik tentangnya.
Saya sedang menyiapkan perbandingan terperinci dengan model penalaran lainnya.
Saya akan segera menyelenggarakan lokakarya tentang Grok 4 untuk anggota akademi kami:

2,19M
Teratas
Peringkat
Favorit