LRM Token-Ökonomie: ein Bericht über die Effizienz des Denkens in LLMs (bei einer Reihe von Problemen, die die meisten von ihnen mit nahezu 1.0 Genauigkeit lösen können). Viele interessante Erkenntnisse, aber zuerst die wichtigsten Punkte: V3.1 ist gleichauf mit Sonnet 4. Es ist viel weniger ein Murmeltier als 0528.
2,52K