Roon (@tszzl) diz que o GPT-3 foi seu "primeiro momento de arrepiar os cabelos e parecia inteligente de maneiras que não eram triviais. Mas também foi aleatório: talvez 1/20 conclusões fizessem sentido." Agora as modelos passam por pós-treino, o que "queima" seu estilo. Claudes tardios se assemelham ao Claude inicial. Groks tardios se assemelham ao Grok inicial. É por isso que todos os modelos de hoje soam iguais.