Claude 4.5 Sonnet – це стрибок вперед у порівнянні з використанням комп'ютерів OSWorld, з 42% до 61% Але OSWorld тестує його на невеликих, досить простих завданнях. Як це означає довгострокову самостійну суб'єктність? Щоб з'ясувати це, ми додали Sonnet 4.5 до AI Village. 🧵 перших вражень