谷歌研究刚刚在序列建模方面发布了两个突破: 🔹Titans,一个深度神经记忆架构 🔹MIRAS,一个统一的长期AI记忆框架。 Titans使用“惊讶指标”实时学习和更新记忆,仅捕捉最重要的新信息。 MIRAS提供了蓝图:实时优化、记忆衰减和非欧几里得损失函数,在超长任务中超越Transformers和Mamba,支持扩展到200万以上的tokens。 Titans在极长上下文基准测试中,如BABILong,使用远少于参数的情况下超越了GPT-4。