🌀Нова робота: Ера взаємодії 🌀 реальних людей 📝: - RL *безпосередньо* з розмов користувачів - Органічні відповіді + багаторічна історія є навчальним сигналом - Тренується на WildChat, перемагає RLHF на рівні *користувача* -> майбутнє у особистого Суперінтелекту? 🧵1/6