I dag lanserar vi Power Retention, en ny arkitektur som sträcker sig längre än till Transformers. Det gör det möjligt för LLM:er att hantera miljontals tokens effektivt, vilket låser upp applikationer med lång kontext som tidigare var för dyra.