Autonome Geheugenbeheer in LLM Agents LLM agents hebben moeite met taken op lange termijn vanwege contextbloat. Naarmate de interactiegeschiedenis groeit, exploderen de computatiekosten, neemt de latentie toe en verslechtert het redeneren door afleiding van irrelevante fouten uit het verleden. De standaardaanpak is append-only: elke gedachte, toolaanroep en reactie accumuleert permanent. Dit werkt voor korte taken, maar garandeert falen bij complexe verkenning. Dit onderzoek introduceert Focus, een agentgerichte architectuur geïnspireerd door slijmzwam (Physarum polycephalum). De biologische inzicht: organismen behouden geen perfecte verslagen van elke beweging door een doolhof. Ze behouden de geleerde kaart. Focus geeft agents twee nieuwe primitieve functies: start_focus en complete_focus. De agent beslist autonoom wanneer hij leerervaringen moet consolideren in een persistente Kennisblok en snoeit actief de ruwe interactiegeschiedenis. Geen externe timers of heuristieken die compressie afdwingen. Het verklaart wat je onderzoekt, verkent met standaardtools en consolideert vervolgens door samen te vatten wat er is geprobeerd, wat er is geleerd en de uitkomst. Het systeem voegt dit toe aan een persistente Kennisblok en verwijdert alles tussen het controlepunt en de huidige stap. Dit converteert monotonisch toenemende context in een zaagtandpatroon: groei tijdens verkenning, ineenstorting tijdens consolidatie. Evaluatie op SWE-bench Lite met Claude Haiku 4.5 toont aan dat Focus 22,7% tokenreductie bereikt (van 14,9M naar 11,5M tokens) terwijl de nauwkeurigheid identiek blijft (60% voor zowel baseline als Focus). Individuele gevallen toonden besparingen tot 57%. Aggressieve prompting is belangrijk. Passieve prompting leverde slechts 6% besparingen op. Expliciete instructies om elke 10-15 toolaanroepen te comprimeren, met systeemherinneringen, verhoogden de compressies van 2,0 naar 6,0 per taak. Capabele modellen kunnen autonoom hun context zelf reguleren wanneer ze de juiste tools en prompting krijgen, waardoor paden worden geopend voor kostenbewuste agentische systemen zonder in te boeten op taakprestaties. Paper: Leer effectieve AI-agents te bouwen in onze academie: