AI代理在狹窄範圍的任務上表現得*很棒*,但在更廣泛的範圍內仍然太不可靠。真正的問題是,這種情況會多快改變?
1.4K