Roon (@tszzl) dit que GPT-3 a été son "premier moment palpitant et il semblait intelligent de manière non triviale. Mais c'était aussi aléatoire : peut-être 1/20 des complétions avaient du sens." Maintenant, les modèles passent par un post-entraînement, qui "ancre" leur style. Les Claudes tardifs ressemblent aux premiers Claude. Les Groks tardifs ressemblent aux premiers Grok. C'est pourquoi les modèles d'aujourd'hui se ressemblent tous.