🌀Nuevo trabajo: Era de la Interacción Humana en el Mundo Real 🌀 📝: - RL *directamente* de Conversaciones de Usuarios - Respuestas orgánicas + historial a largo plazo son señales de aprendizaje - Entrenado en WildChat, supera a RLHF a nivel *usuario* -> ¿el futuro de la Superinteligencia personal? 🧵1/6