Memperkenalkan gelembung pikiran: LM *sepenuhnya tanpa pengawasan* untuk penalaran laten paralel adaptif input ✅ Pelajari sendiri model penalaran dengan prapelatihan normal ✅ Kebingungan yang lebih baik dibandingkan dengan token pemikiran tetap Tidak ada kerugian mewah, tidak ada rantai label 🚀 pemikiran