很多人问我为什么我一直在使用 @FactoryAI CLI 作为我的日常工具,这就是原因 - Terminal-Bench 中前 5 名代理中的 3 名(每个顶级模型中表现最佳) - 使用 opus 4.1 的顶级代理,准确率为 58.8% 这也与我的 vibe bench 一致!🔥