Economia del Token LRM: un rapporto sull'efficienza del ragionamento negli LLM (su un insieme di problemi che la maggior parte di essi può risolvere con un'accuratezza vicina a 1.0). Molti risultati interessanti, ma prima le cose fondamentali: La V3.1 è alla pari con Sonnet 4. È molto meno confusa rispetto al 0528.
2,53K