LRM Token Economy: un informe sobre la eficiencia del razonamiento en los LLM (sobre un conjunto de problemas que la mayoría de ellos pueden resolver con una precisión cercana a 1.0). Muchos hallazgos interesantes, pero lo primero es lo primero: V3.1 está a la par con el Soneto 4. Es mucho menos murmurador que 0528.
2.53K