進行了一項 10k 的 A/B/N 測試,對比 GPT-4.1、GPT-5 和 Sonnet 4 在撰寫商業文件方面的表現 - GPT 4.1 和 Sonnet 4 在感知質量上相等 (📈 正面反饋, 📉 負面反饋) - GPT 4.1 始終是最快的 - Sonnet 4 的寫作量略高於 GPT 模型