🌀Nowa praca: Era interakcji międzyludzkiej w rzeczywistym świecie 🌀 📝: - RL *bezpośrednio* z rozmów użytkowników - Organiczne odpowiedzi + długoterminowa historia to sygnał uczenia się - Trenowane na WildChat, przewyższa RLHF na poziomie *użytkownika* -> przyszłość dla osobistej Super Inteligencji? 🧵1/6