Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Интересный факт: RLing большинства моделей открытого веса размером 8b (таких как qwen 3) напрямую на тестовом наборе для агентных бенчмарков (таких как TerminalBench) не работает. Они просто не могут угадать правильный ответ в разумных пределах бюджета выборки. Я не могу дождаться, когда первая модель 8b получит какой-то нетривиальный балл на этих бенчмарках!
Топ
Рейтинг
Избранное