今天,我们发布了 Power Retention,这是一种超越 Transformers 的新架构。 它使 LLM 能够高效处理数百万个标记,解锁了之前成本过高的长上下文应用。