Roon (@tszzl) 说 GPT-3 是他 "第一次令人毛骨悚然的时刻,它在某些方面显得聪明,而这些并不平凡。但它也很随机:也许 1/20 的完成是有意义的。" 现在的模型经过后期训练,这种训练 "灼烧" 了它们的风格。晚期的 Claude 类似于早期的 Claude。晚期的 Grok 类似于早期的 Grok。这就是为什么今天的模型听起来都很相似。