Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Teknium (e/λ)
.@UnslothAI telah mengunggah 70 miliar GGUF sekarang juga :)

Nous Research22 jam lalu
Nous Research menghadirkan Hermes 4, lini model penalaran hibrida terbaru kami.
Hermes 4 dibangun di atas warisan model kami yang selaras dengan pengguna dengan kemampuan komputasi waktu pengujian yang diperluas.
Perhatian khusus diberikan untuk membuat model kreatif dan menarik untuk berinteraksi, tidak terbebani oleh sensor, dan selaras secara netral sambil mempertahankan kinerja matematika, pengkodean, dan penalaran tingkat canggih untuk model bobot terbuka.

5,84K
Tonggak sejarah besar bagi Hermes.
Kami melakukan banyak pekerjaan untuk membuat model terbuka tingkat perbatasan yang tidak mendikte ekspresi apa yang dapat Anda dapatkan dari model.
Super kuat dalam matematika, pengkodean, STEM, dan kreativitas.
Bobot Model:
Lihat 👇

Nous Research22 jam lalu
Nous Research menghadirkan Hermes 4, lini model penalaran hibrida terbaru kami.
Hermes 4 dibangun di atas warisan model kami yang selaras dengan pengguna dengan kemampuan komputasi waktu pengujian yang diperluas.
Perhatian khusus diberikan untuk membuat model kreatif dan menarik untuk berinteraksi, tidak terbebani oleh sensor, dan selaras secara netral sambil mempertahankan kinerja matematika, pengkodean, dan penalaran tingkat canggih untuk model bobot terbuka.

45,98K
Teknium (e/λ) memposting ulang
Karena semua orang berbicara tentang RL Environments dan GRPO sekarang tetapi tidak ada yang tahu cara kerjanya, kami pikir akan keren untuk membuat video penjelasan + kode yang dapat Anda jalankan:
Ini adalah contoh penggunaan GRPO untuk melatih Qwen 2.5 untuk memainkan 2048 (kode dalam utas): 🧵
112,31K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal