Hoje, estamos lançando a Retenção de Energia, uma nova arquitetura além dos Transformers. Ele permite que os LLMs lidem com milhões de tokens com eficiência, desbloqueando aplicativos de contexto longo que antes eram muito caros.