Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research menghadirkan Hermes 4, lini model penalaran hibrida terbaru kami.
Hermes 4 dibangun di atas warisan model kami yang selaras dengan pengguna dengan kemampuan komputasi waktu pengujian yang diperluas.
Perhatian khusus diberikan untuk membuat model kreatif dan menarik untuk berinteraksi, tidak terbebani oleh sensor, dan selaras secara netral sambil mempertahankan kinerja matematika, pengkodean, dan penalaran tingkat canggih untuk model bobot terbuka.

10,73K
Nous Research memposting ulang
1/10🧵 @nousresearch baru-baru ini menerbitkan sebuah studi menarik yang menunjukkan model terbuka menggunakan token 2-3x lebih banyak daripada model tertutup untuk tugas penalaran.
Kami menguji apakah alokasi token dinamis dapat membantu mengatasi kesenjangan efisiensi ini. Inilah yang kami pelajari 👇
8,02K
Mengukur Efisiensi Berpikir dalam Model Penalaran: Tolok Ukur yang Hilang
Kami mengukur penggunaan token di seluruh model penalaran: model terbuka menghasilkan 1,5-4x lebih banyak token daripada model tertutup pada tugas yang identik, tetapi dengan variasi besar tergantung pada jenis tugas (hingga 10x pada pertanyaan sederhana).
Biaya tersembunyi ini sering kali meniadakan keuntungan harga per token. Efisiensi token harus menjadi target utama di samping tolok ukur akurasi, terutama mengingat kasus penggunaan non-penalaran.
Baca tinjauan menyeluruh tentang efisiensi penalaran di seluruh lanskap model terbuka dan tertutup di posting blog terbaru kami bekerja sama dengan peneliti kami, Tim.
Lihat lebih banyak karya mereka di sini:

48,69K
Nous Research memposting ulang
Lingkungan eval Arena-Hard sekarang digabungkan ke Atropos - nikmati evaluasi yang dapat diskalakan, fleksibel, dan modern dengan tolok ukur arena-hard @lmsysorg yang sangat bagus dalam menentukan berbagai kemampuan dalam model.
Siap menjadi lingkungan RL jika Anda membawa set kereta sendiri juga :)
Pelajari lebih lanjut di

6,95K
Peneliti kami di Residensi @yaboilyrical akan membahas karyanya tentang kemudi SMC di UC Berkeley pada 3 Agustus.
Lihat blog tentang karya ini di sini:
Detail di bawah ini!

nightwing25 Jul 2025
Senang mengumumkan bahwa saya akan menjadi pembicara di @BerkeleyRDI DeAI Summit, mempresentasikan penelitian saya dengan @NousResearch tentang decoding bahasa terbatas!
Jika Anda menghadiri KTT, atau ingin datang melihat pembicaraan saya, silakan hubungi saya!

10,96K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal