ReasoningBank: memória para agentes LLM autoevolutivos • Destila estratégias de sucessos e fracassos • Permite que os agentes aprendam, reutilizem e melhorem ao longo do tempo • Supera os métodos de memória anteriores em tarefas web e SWE (+34,2% ef., –16% passos)