🌀Neue Arbeit: Ära der realen menschlichen Interaktion 🌀 📝: - RL *direkt* aus Benutzerkonversationen - Organische Antworten + langfristige Historie sind Lernsignale - Trainiert auf WildChat, schlägt RLHF auf *Benutzer*-Ebene -> die Zukunft für persönliche Superintelligenz? 🧵1/6