Le valutazioni sono necessarie ma non sufficienti Sia Sonnet 4.5 che GLM 4.6 hanno pubblicato risultati di test A/B con esperti in diverse categorie per i loro nuovi modelli