اقتصاد رمز LRM: تقرير عن كفاءة التفكير في LLMs (حول مجموعة من المشكلات التي يمكن لمعظمها حلها بدقة تقترب من 1.0). الكثير من النتائج المثيرة للاهتمام ، ولكن أول الأشياء أولا: V3.1 على قدم المساواة مع Sonnet 4. إنه أقل بكثير من غمغمة من 0528.
‏‎2.54‏K