Kinh tế Token LRM: một báo cáo về hiệu quả lý luận trong các LLM (trên một tập hợp các vấn đề mà hầu hết chúng có thể giải quyết với độ chính xác gần 1.0). Nhiều phát hiện thú vị, nhưng trước hết: V3.1 ngang bằng với Sonnet 4. Nó ít nói lắp hơn nhiều so với 0528.
2,55K