Claude 4.5 Sonnet er et sprang fremover på OSWorld-målestokken for datamaskinbruk, fra 42 % til 61 % Men OSWorld tester det på små, ganske enkle oppgaver. Hvordan oversettes dette til langsiktig selvstyrt handlefrihet? Vi la til Sonnet 4.5 i AI Village for å finne ut av det. 🧵 av førsteinntrykk