🌀Nieuwe werk: Tijdperk van Echte Menselijke Interactie 🌀 📝: - RL *direct* uit Gebruikersgesprekken - Organische antwoorden + lange termijn geschiedenis zijn leersignalen - Getraind op WildChat, verslaat RLHF op *gebruikers*niveau -> de toekomst voor persoonlijke Super Intelligentie? 🧵1/6