LRM Token Economie: een rapport over redeneerefficiëntie in LLM's (over een set problemen die de meesten van hen met bijna 1.0 nauwkeurigheid kunnen oplossen). Veel interessante bevindingen, maar eerst de belangrijkste punten: V3.1 is gelijkwaardig aan Sonnet 4. Het is veel minder een mompelaar dan 0528.
2,55K