想象一下,如果你的AI助手能记住你的每一次对话、每一个偏好,能够真正理解你记住你做过的事情…
加州大学圣迭戈分校博士生Yu Wang与纽约大学教授Xi Chen合作提出了MIRIX —— 全球首个真正具备多模态长期记忆的AI系统,项目同时发布了可直接使用的Mac桌面应用。

解决什么问题?
现有AI助手的一个明显局限是缺乏持续记忆能力。每次对话结束后,之前的交互信息就会丢失。RAG(检索增强生成)虽然能补充一些信息,但在处理多模态数据和长期记忆方面仍有不足。
MIRIX的技术方案
六模块记忆架构

与一般系统将记忆分为长期记忆和短期记忆不同,MIRIX将AI记忆分为六个功能模块:
- 核心记忆:存储用户基本信息和偏好
- 情景记忆:记录按时间排序的事件和对话
- 语义记忆:保存概念性知识和事实
- 程序记忆:存储操作流程和任务步骤
- 资源记忆:管理文档、截图等工作资料
- 知识金库:安全存储敏感信息
多智能体协作架构
MIRIX采用分层管理的多智能体系统,包含1个元记忆管理者(Meta Memory Manager)和6个专门的记忆管理者。
元记忆管理者的职责:
- 分析输入内容,判断应该激活哪些记忆模块
- 协调各个记忆管理者的工作流程
- 处理记忆检索请求的路由分发
- 监控整个记忆系统的运行状态
六个专门管理者分工:每个记忆模块都有专门的管理者负责:
- 核心记忆管理者:维护用户基本信息,当容量超过90%时自动重写压缩
- 情景记忆管理者:按时间戳记录和索引事件,支持时间范围查询
- 语义记忆管理者:构建和维护概念知识图谱,处理实体关系
- 程序记忆管理者:结构化存储操作流程,支持步骤化调用
- 资源记忆管理者:管理多模态资源的存储和检索
- 知识金库管理者:处理敏感信息的加密存储和权限控制
工作流程:
记忆更新流程:
- 用户输入(对话或屏幕截图)触发全局记忆搜索
- 元管理者分析内容,确定需要更新的记忆模块
- 相关的专门管理者并行处理更新任务,去除重复信息
- 更新完成后,元管理者汇总结果并通知系统进入下一轮

记忆检索流程:
- 聊天代理根据用户问题自动生成检索主题
- 元管理者将检索请求分发到相关的记忆模块
- 各专门管理者从自己的模块中检索top-k相关信息
- 检索结果按来源标记(如<episodic_memory>、<semantic_memory>等)
- 聊天代理基于检索到的记忆信息生成回答

这种多智能体设计确保了记忆系统的高效运行,避免了单一智能体处理复杂记忆任务时的性能瓶颈。
性能表现
ScreenshotVQA测试(基于45,000张高分辨率截图):
- 相比RAG方法,准确率提升35%,存储开销降低99.9%
- 相比长文本方法,准确率提升410%,存储开销降低93.3%

LOCOMO长对话测试:
- 准确率达到85.4%,超越所有现有记忆系统

桌面应用
访问 mirix.io 可直接下载Mac版应用程序:

- 安装后配置Gemini API Key
- 应用会自动记录屏幕活动和对话
- 通过可视化界面查看和管理记忆
- 与AI助手对话时能调用历史信息
- 应用场景如下:
- 工作助手:基于历史项目经验协助写作申请或报告:

- 活动回顾:回顾某一时间段的工作内容和进展

- 记忆可视化(下图是一个Semantic Memory的示例

隐私和安全
所有记忆数据存储在本地SQLite数据库中,不会上传到云端。敏感信息通过知识金库模块进行加密存储和访问控制。
项目信息
- 论文:https://arxiv.org/abs/2507.07957
- 官网:https://mirix.io/
- 开源:https://github.com/Mirix-AI/MIRIX
- 应用下载:https://mirix.io/(Mac版)
MIRIX为AI记忆系统提供了一个完整的解决方案,既有学术研究价值,也提供了实际可用的应用程序。对于需要长期记忆能力的AI应用场景,这个项目提供了可行方案。
本文转载自AI-PaperDaily,作者:MIRIX AI