Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
RLHI: Обучение с подкреплением на основе взаимодействия с человеком
• Выходит за рамки данных, аннотированных экспертами → учится на реальных пользовательских разговорах
• Два метода:
1. Переписывание с помощью пользователя
2. Награды на основе пользователя
• Превосходит базовые модели в персонализации, следовании инструкциям и рассуждении

Топ
Рейтинг
Избранное