鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理原创精华

发布于 2025-7-15 08:56

浏览

0收藏

论文提出了一个卓越的记忆框架——MemOS，它将记忆功能提升为系统级调用。大语言模型遗忘速度快，重新训练成本高昂。MemOS将记忆视为操作系统中的文件，让模型能够在运行时动态地写入、移动和淘汰知识，而不仅仅是在训练期间。它将每个事实或状态封装在一个记忆立方体（MemCube）中，标记创建者和时间戳，然后调度器根据使用情况将该立方体在纯文本、GPU缓存或微型权重补丁之间移动。在LOCOMO基准测试中，该系统达到73.31分的LLM-Judge平均分，比次佳记忆系统高出约9分，在复杂的多跳和时序问题上保持领先。即使处理约1500个记忆令牌，它也能匹配全上下文的准确性，同时保持与轻量级基线相当的延迟。将热点立方体切换到KV缓存可在Qwen2.5-72B测试中将首令牌等待时间减少91.4%，且不改变任何输出文本。总体而言，研究结果表明，将记忆作为操作系统的方法能够提升推理质量、降低延迟，并同时内置审计和版本控制功能。

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理-AI.x社区图片

记忆系统的困境：大多数模型将所有信息压缩到数十亿个冻结权重中，因此更新哪怕一个事实都需要完整的微调。上下文窗口虽然能暂时帮助，但会在下一个提示后消失，而检索管道会添加额外文本却不跟踪版本或所有权。第2页的图1显示MemOS在单跳、多跳、开放域和时序问题上都优于旧有解决方案，这表明单纯的参数调整或普通的RAG永远不够。

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理-AI.x社区图片

记忆立方体的内容：记忆立方体封装实际记忆加上元数据，如所有者、时间戳、优先级和访问规则。该封装适用于三种记忆形式：纯文本片段、位于KV缓存中的激活张量，以及低秩参数补丁。由于每个立方体都记录访问者和原因，调度器可以将热点立方体提升到GPU缓存或将冷门立方体存储到归档存储中，同时不丢失审计轨迹。

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理-AI.x社区图片

三层架构的协同工作：接口层将用户对话转换为结构化的MemoryAPI调用，将"去年的检查"之类的问题转化为时间范围查询。操作层运行MemScheduler、MemOperator和MemLifecycle来选择立方体、融合重叠内容，并将这些立方体标记为激活、合并或归档状态。基础设施层通过MemGovernance保护立方体，通过MemLoader/MemDumper传输它们，并将它们存储在MemVault中，后者可以是向量存储、图数据库或对象存储桶。

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理-AI.x社区图片

调度器保持记忆新鲜：MemScheduler决定哪个立方体放置在何处。高命中率的纯文本转换为激活张量以便即时重用，稳定的激活模式最终蒸馏为参数补丁以实现零提示开销。旧立方体则反向滑动，一旦停止获得命中，昂贵的权重就转换为便宜的文本。

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理-AI.x社区图片

数据验证效果：在LOCOMO基准测试中，MemOS获得73.31分的LLM-Judge分数，比次佳系统高出约9分，同时保持相似的延迟预算。在多跳和时序推理方面差距尤其明显，这些领域在上下文缺失时容易崩溃。

MemOS：让大模型告别遗忘、拥有操作系统级记忆管理-AI.x社区图片

KV技巧缩短等待时间：MemScheduler将热门立方体预先烘焙为KV缓存条目，使模型跳过编码器工作。在Qwen2.5-72B测试中，首令牌延迟从1.79秒降至0.15秒，减少91%，输出文本保持逐字节相同。

论文标题：MemOS: A Memory OS for AI System

论文链接：https://arxiv.org/abs/2507.03724

本文转载自AI帝国，作者：无影寺

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

赞

收藏

回复

举报

回复

相关推荐

开源大模型AI代理操作系统：像Windos一样，操控AI代理

Aceryt • 4717浏览 • 0回复
生成式AI如何告别版权困扰？基于权重显著性的机器遗忘算法有奇效

轻薄滴假象 • 3640浏览 • 0回复
大语言模型高效推理知多少？三万字长文带你揭开神秘面纱（数据级、模型级和系统级）

angel • 1.6w浏览 • 0回复
开源操作系统陆续举起“禁令”，Debian尚无行动

51CTO技术栈 • 3274浏览 • 0回复
谷歌提出视觉记忆方法，让大模型训练数据更灵活

Aceryt • 3153浏览 • 0回复
大模型的记忆困境：平衡持续学习与灾难性遗忘

芝士AI吃鱼 • 8123浏览 • 0回复
告别800秒魔咒！硬件级STA革新视频DiT注意力，让HunyuanVideo效率提升3.5倍!

angel • 3471浏览 • 0回复
Unsloth开源新算法：让GRPO训练大模型所需显存降低90%，告别显存焦虑！

sbf_2000 • 4361浏览 • 0回复
从传统到智能：LLM操作系统的崛起与变革

十一月雨_55 • 3354浏览 • 0回复
Mem0 让 AI 拥有超强记忆能力

丢翅膀的鱼 • 5816浏览 • 0回复
PromptPro：AI提示词管理神器，从此告别杂乱无章！

Halo咯咯 • 6980浏览 • 0回复
首次全面复盘AI Agents记忆系统：3大类，6种操作！

PaperAgent • 3980浏览 • 0回复
具备记忆的智能体操作系统，MemoryOS重构AI Agent对话的持久性与个性化

xuxiangda • 4738浏览 • 0回复
中国队开源首个“类人记忆”操作系统：MemOS，性能超OpenAI方法159%

51CTO技术栈 • 2502浏览 • 0回复
AI终于有了"记忆"——MIRIX革命性突破，让每个人都能拥有专属数字大脑

AIPaperDaily • 3415浏览 • 0回复
基于 AI Agent 的操作系统架构设计详解

玄姐聊AGI • 1481浏览 • 0回复
让Agents更聪明，3招搞定记忆管理！

探索AGI • 1302浏览 • 0回复
开发者必看：谷歌如何用AI打造“机器人操作系统”

七牛云行业应用 • 1488浏览 • 0回复
“LLM即操作系统”：Karpathy的理论对企业IT架构的启示

七牛云行业应用 • 518浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

Dr.LLM：大语言模型中的动态层路由 4h前发布
Inoculation Prompting：让大模型在训练时“学坏”，测试时更听话 4h前发布

热门推荐

阿里新一代企业级多 AI 智能体开发框架 AgentScope 技术架构全解析 0回复

代码41%由AI生成！2025七大编程工具深度对比，你的选择是？ 0回复

DeepSeek 成长史：从量化投资到 AI 革命的一个 “非主流” 量化大佬的 AI 梦 0回复

Qwen3-Omni-30B-A3B-Instruct 部署实战保姆及教程（图片、语音、视频全模态识别） 0回复

Cursor 1.3 ~ 1.6 版本更新全梳理：终端不再挂、Agent 更聪明、上下文更可控 0回复

上一篇：微软发布了 Phi-4-mini-flash-reasoning 模型

下一篇： Voxtral：Mistral开源的语音识别模型！

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载