Les évaluations sont nécessaires mais pas suffisantes Les résultats des tests A/B de Sonnet 4.5 et GLM 4.6 ont été publiés avec des experts dans différentes catégories pour leurs nouveaux modèles