ReasoningBank:自我演化 LLM 代理的記憶 • 從成功和失敗中提煉策略 • 使代理能夠隨著時間學習、重用和改進 • 在網絡和 SWE 任務上超越以往的記憶方法(+34.2% 效率,–16% 步驟)