DApp Store | Pusat Web3 untuk Event & Game

Jelajahi Giveaway Web3 untuk reward lebih menarik

Topik trending

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,43%

Boopa+2,48%

PORK+4,45%

Tim Dettmers

Tim Dettmers20 Sep, 04.06

Melihat lebih dekat, PyTorch juga menggunakan FP32, tetapi inilah alasan sebenarnya mengapa bnb Adam lebih baik: kami mengoptimalkan untuk numerik float, urutan itu penting! Menghitung sqrt(v) + eps*c2 kemudian membagi menghindari kesalahan penguatan vs sqrt(v)/c2 + eps PyTorch. Matematika yang sama, stabilitas yang lebih baik!

Tim Dettmers19 Sep, 21.50

Mendengar dari tim bitsandbytes Adam 32-bit menghasilkan kerugian dan stabilitas yang lebih baik daripada PyTorch Adam. Kami melakukan semua perhitungan di fp32, jadi tidak masalah gradien apa yang Anda miliki; perhitungannya lebih tepat. Ini mirip dengan akumulasi DeepSeek fp32 di matmul 8-bit mereka.

875

Tim Dettmers19 Sep, 21.50

111

Tim Dettmers8 Sep, 19.57

Rasanya perbatasan agen pengkodean sekarang menjadi bobot terbuka: GLM 4.5 hanya berharga $3/bulan dan setara dengan Sonnet Kimi K2.1 Turbo adalah kecepatan 3x, 7x lebih murah vs Opus 4.1, tetapi sama bagusnya Kimi K2.1 terasa bersih. Model terbaik untuk saya. GPT-5 hanya bagus untuk spesifikasi yang rumit -- terlalu lambat.

1,14K

Teratas

Peringkat

Favorit