Przedstawiamy 𝘁𝗵𝗼𝘂𝗴𝗵𝘁𝗯𝘂𝗯𝗯𝗹𝗲𝘀: *w pełni niesuperwizowany* LM do adaptacyjnego rozumowania równoległego ✅ Naucz się modelu rozumowania z normalnym wstępnym treningiem ✅ Lepsza złożoność w porównaniu do stałych tokenów myślowych Bez wymyślnych strat, bez etykiet łańcucha myśli 🚀