进行了一个10k的A/B/N测试,比较了GPT-4.1、GPT-5和Sonnet 4在撰写商业文件方面的表现 - GPT 4.1和Sonnet 4在感知质量上相等(📈 正面反馈,📉 负面反馈) - GPT 4.1始终是最快的 - Sonnet 4的写作量略高于GPT模型