🌀Karya baru: Era Interaksi 🌀 Manusia Dunia Nyata 📝: - RL *langsung* dari Percakapan Pengguna - Balasan organik + riwayat jangka panjang adalah sinyal pembelajaran - Dilatih di WildChat, mengalahkan RLHF di tingkat *pengguna* -> masa depan untuk Kecerdasan Super pribadi? 🧵1/6