LRM Token Economy: звіт про ефективність міркувань у LLM (по набору проблем, більшість з яких можуть вирішити з точністю близько 1.0). Багато цікавих знахідок, але про все по порядку: V3.1 стоїть на одному рівні з Сонетом 4. Це набагато менше бурмотіння, ніж 0528.
2,53K