ReasoningBank: memória para agentes LLM auto-evolutivos • Destila estratégias tanto de sucessos quanto de falhas • Permite que os agentes aprendam, reutilizem e melhorem ao longo do tempo • Supera métodos de memória anteriores em tarefas da web e SWE (+34,2% de eficiência, –16% de passos)