🌀Novo trabalho: Era da Interação Humana do Mundo Real 🌀 📝: - RL *diretamente* das conversas do usuário - Respostas orgânicas + histórico de longo prazo são sinal de aprendizado - Treinado no WildChat, vence o RLHF no nível *usuário* -> o futuro da Super Inteligência pessoal? 🧵1/6