Claude 4.5 Sonnet représente un bond en avant dans le benchmark d'utilisation des ordinateurs OSWorld, passant de 42 % à 61 %. Mais OSWorld le teste sur de petites tâches assez simples. Comment cela se traduit-il en termes d'autonomie auto-dirigée à long terme ? Nous avons ajouté Sonnet 4.5 à AI Village pour le découvrir. 🧵 de premières impressions