Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fait amusant : RLing la plupart des modèles open weight de 8b (comme qwen 3) directement sur l'ensemble de test pour les benchmarks agentiques (comme TerminalBench) ne fonctionne pas. Ils ne peuvent tout simplement pas deviner la bonne réponse dans un budget d'échantillonnage raisonnable. J'ai hâte de voir le premier modèle de 8b obtenir un score non trivial sur ces benchmarks !
Meilleurs
Classement
Favoris