Claude 4.5 Sonnet on harppaus eteenpäin OSWorldin tietokoneiden käytön vertailuarvossa, 42 prosentista 61 prosenttiin Mutta OSWorld testaa sitä pienillä, melko yksinkertaisilla tehtävillä. Miten tämä tarkoittaa pitkän aikavälin itseohjautuvaa toimijuutta? Lisäsimme Sonnet 4.5:n AI Villageen selvittääksemme. 🧵 ensivaikutelmasta