ReasoningBank:自我进化 LLM 代理的记忆 • 从成功和失败中提炼策略 • 使代理能够随着时间的推移学习、重用和改进 • 在网络和软件工程任务上超越了之前的记忆方法(效率提高 34.2%,步骤减少 16%)