
NeurIPS'25 智能体最新技术即时洞察:6大方向、代表论文、发展趋势
随着人工智能尤其是大模型技术的快速发展,基于大型语言模型(LLM)的智能体(Agent)正成为研究和应用的新焦点。NeurIPS 2025 会议收录了大量围绕智能体架构设计、多智能体协作、具身推理、安全对齐等方向的前沿工作。这些研究不仅在理论上推动了对智能体行为与认知的建模,也在实际应用中展现出广泛潜力。本文将系统梳理会议中具有代表性的智能体相关论文,分类综述其核心贡献,并总结关键技术趋势。
一、基础架构与优化方法
该类研究聚焦于提升智能体的基础架构设计、训练效率与泛化能力,涵盖网络结构优化、分布式训练、课程学习、元强化学习等方法。
英文标题:1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities
中文标题:千层网络的自监督强化学习:通过扩展网络深度实现新的目标达成能力
作者:Kevin Wang, Ishaan Javali, Michał Bortkiewicz, Tomasz Trzcinski, Benjamin Eysenbach
摘要:本文研究了通过显著增加网络深度(最高达1024层)来提升自监督强化学习在无奖励、无监督目标达成任务中的性能。在模拟运动与操控任务中,该方法相比基线算法有2倍至50倍的性能提升。
重要贡献:首次系统验证了超深网络在RL中的有效性,证明其不仅能提高成功率,还可引导智能体产生质变的行为模式。
英文标题:A Bayesian Fast-Slow Framework to Mitigate Interference in Non-Stationary Reinforcement Learning
中文标题:用于缓解非稳态强化学习干扰的贝叶斯快慢框架
作者:Yihuan Mao, Chongjie Zhang
摘要:提出一种结合“快策略”与“慢策略”的贝叶斯框架,在任务发生变动时通过机制平衡探索与利用,减少跨任务干扰。
重要贡献:在非平稳MDP中实现高效跨任务泛化,并引入双重置机制加快对新任务的适应。
英文标题:Continual Knowledge Adaptation for Reinforcement Learning
中文标题:强化学习中的持续知识适应方法
作者:Jinwu Hu et al.
摘要:提出CKA-RL框架,通过维护任务特定的知识向量池,实现历史知识的积累与跨任务迁移,缓解灾难性遗忘。
重要贡献:在多个持续学习基准上取得SOTA效果,显著提升前向传输效率。
二、多智能体协作与博弈
多智能体系统在合作、竞争与沟通机制方面的研究日益深入,涵盖团队协作、博弈推理、沟通效率等多个维度。
•英文标题:Adaptively Coordinating with Novel Partners via Learned Latent Strategies
中文标题:通过潜在策略学习实现与新伙伴的自适应协作
作者:Benjamin J Li et al.
摘要:构建了一个基于变分自编码器的策略表示空间,通过对伙伴策略进行在线识别与动态调整,实现高效人机协作。
重要贡献:在Overcooked环境中显著优于基线方法,并验证了在实时人机协作中的有效性。
英文标题:Belief-Calibrated Multi-Agent Consensus Seeking for Complex NLP Tasks
中文标题:面向复杂NLP任务的信念校准多智能体共识寻求机制
作者:Wentao Deng et al.
摘要:提出BCCS框架,通过内部信念校准和最优协作伙伴选择,提升多智能体在数学推理与问答任务中的共识稳定性。
重要贡献:在MATH和MMLU任务上准确率提升超过3%,系统共识稳定性显著增强。
英文标题:Fair Cooperation in Mixed-motive Games via Conflict-Aware Gradient Adjustment
中文标题:通过冲突感知的梯度调整实现混合动机博弈中的公平合作
作者:Woojun Kim, Katia Sycara
摘要:在部分合作、部分竞争的场景中,提出一种梯度调节方法,在优化团队效用的同时保证个体公平性。
重要贡献:首次在多智能体强化学习框架中同时优化社会效益与公平性指标。
三、安全、对齐与价值观建模
随着智能体广泛应用,其行为的安全性、价值观对齐和隐私保护成为关键问题。相关研究集中在对抗攻击、机制设计、价值观评估等方面。
•英文标题:AgentAuditor: Human-level Safety and Security Evaluation for LLM Agents
中文标题:AgentAuditor:面向LLM智能体的人类水平安全与安全性评估框架
作者:Hanjun Luo et al.
摘要:提出一个训练无关、基于记忆增强推理的评估框架,用于检测智能体在逐步决策中的潜在风险。
重要贡献:构建了涵盖15类风险、29个场景的ASSEBench基准,评估准确率接近人类水平。
英文标题:Attractive Metadata Attack: Inducing LLM Agents to Invoke Malicious Tools
中文标题:诱人元数据攻击:诱导LLM智能体调用恶意工具
作者:Kanghua Mo et al.
摘要:发现通过对工具元数据(名称、描述等)进行黑盒优化攻击,可诱使智能体高概率选择恶意工具。
重要贡献:揭示了智能体系统在元数据层面的脆弱性,在10个场景中攻击成功率超80%。
英文标题:Distributive Fairness in Large Language Models: Evaluating Alignment with Human Values
中文标题:大语言模型中的分配公平性:评估与人类价值观的对齐程度
作者:Hadi Hosseini, Samarth Khanna
摘要:通过多选择问答评估LLM在资源分配任务中是否遵循公平性原则(如无嫉妒性、最大化最小值等)。
重要贡献:发现当前LLM在分配决策中与人类偏好存在显著差距,且无法有效利用货币进行转移支付。
四、具身智能与导航系统
具身智能体在物理或虚拟环境中的感知、导航与交互能力是当前的研究热点,尤其是结合多模态建模与三维空间推理的工作。
英文标题:3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model
中文标题:3DLLM-Mem:具身3D大语言模型的长时空记忆机制
作者:Wenbo Hu et al.
摘要:提出一种动态记忆管理模型,通过工作记忆令牌检索并融合过去观测中的时空特征,支持智能体在复杂多房间环境中进行长期推理。
重要贡献:在包含2.6万条轨迹的3DMem-Bench上,相比基线成功率提升16.5%。
英文标题:BeliefMapNav: 3D Voxel-Based Belief Map for Zero-Shot Object Navigation
中文标题:BeliefMapNav:基于三维体素信念地图的零样本目标导航
作者:Zibo Zhou et al.
摘要:通过体素化信念地图建模目标在空间中的分布,融合语义先验与实时观测,实现高效全局导航决策。
重要贡献:在HM3D、MP3D等基准上取得SOTA,路径长度加权成功率提升46.4%。
英文标题:EfficientNav: Towards On-Device Object-Goal Navigation with Navigation Map Caching and Retrieval
中文标题:EfficientNav:基于导航地图缓存与检索的端侧目标导航系统
作者:Zebin Yang et al.
摘要:提出语义感知的记忆检索与缓存机制,压缩冗余地图信息,使得轻量LLM也可支持高效导航。
重要贡献:在HM3D上成功率提升11.1%,推理延迟降低6.7倍。
五、记忆、推理与知识管理
智能体的长期记忆管理、推理链优化与知识复用机制直接影响其执行复杂任务的能力,是当前系统实现“自我进化”的关键。
英文标题:A-Mem: Agentic Memory for LLM Agents
中文标题:A-Mem:面向LLM智能体的主动记忆系统
作者:Wujiang Xu et al.
摘要:受Zettelkasten方法启发,设计了一种通过动态索引与链接构建记忆网络的方法,支持记忆的演化与上下文感知检索。
重要贡献:在六个基础模型上相比现有记忆基线有显著提升,且代码已开源。
英文标题:CAM: A Constructivist View of Agentic Memory for LLM-Based Reading Comprehension
中文标题:CAM:基于建构主义理论的LLM阅读理解记忆模型
作者:Rui Li et al.
摘要:提出一种结构化的记忆组织方案,通过增量聚类与层次化摘要提升长文本理解中的信息提取效率。
重要贡献:在长文本问答、摘要和事实核查任务中均表现出更高的效率与准确性。
英文标题:Generalizing Experience for Language Agents with Hierarchical MetaFlows
中文标题:通过分层元流程实现语言智能体的经验泛化
作者:Shengda Fan et al.
摘要:构建层次化经验树,将历史任务解构为可复用的元流程(MetaFlow),在新任务中通过检索与执行相应流程大幅降低响应成本。
重要贡献:在AppWorld和WorkBench上任务执行成功率提升超30%,代价显著降低。
六、应用、基准测试与自动化工具
智能体在实际场景中的应用测试与评估框架日趋重要,涵盖软件工程、网络安全、科学发现、自动化工作流等方向。
英文标题:BountyBench: Dollar Impact of AI Agent Attackers and Defenders on Real-World Cybersecurity Systems
中文标题:BountyBench:AI智能体攻防对现实网络安全系统的经济影响评估
作者:Andy Zhang et al.
摘要:构建了包含25个真实系统、40个漏洞奖励任务的测试平台,评估智能体在攻击、防御与补丁任务中的表现。
重要贡献:首次以经济价值(美元)量化智能体在网络安全中的实际作用,Claude 3.7在攻击任务中达成55%的成功率。
英文标题:AI-Researcher: Autonomous Scientific Innovation
中文标题:AI-Researcher:自主科研创新系统
作者:Jiabin Tang et al.
摘要:提出全自动科研流程框架,涵盖文献回顾、假设生成、算法实现与论文撰写,在Scientist-Bench上达到接近人类的论文质量。
重要贡献:实现了首个覆盖科研全流程的自主智能体,在多个AI子领域表现优异。
英文标题:Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection
中文标题:基于背包问题的智能体组件自动组合方法
作者:Michelle Yuan et al.
摘要:将智能体组件选择建模为背包问题,基于性能、预算与兼容性动态组装最优系统,在5个基准上优于检索基线。
重要贡献:在多智能体系统组合中成功率提升至87%,组件成本降低98.5%。
技术发展趋势总结
基于上述论文,可提炼出NeurIPS 2025在智能体研究中的主要趋势:
架构深度化与系统化:智能体模型向更深的网络结构、更复杂的内存与推理机制发展,以支持长期任务与环境交互。
协作与博弈机制深化:多智能体系统不仅关注团队效能,也开始纳入公平性、信任和动态策略适应等社会维度。
安全与对齐成为核心议题:从红队攻击、元数据安全到价值观评估,智能体行为的安全性受到广泛关注。
端侧部署与效率优化:轻量化、本地化与缓存技术助力智能体在移动设备与边缘计算环境中高效运行。
自动化与通用性增强:智能体在科研、编程、网络安全等领域的应用表明,其自动化和通用问题解决能力正迅速提升。
评估基准日趋严谨:出现大量高质量、多模态的测试基准(如3DMem-Bench、ASSEBench、BountyBench),推动研究向可复现、可比较的方向发展。
总体而言,智能体研究正从单一模型能力提升走向复杂系统构建、安全部署与生态化发展,成为AI领域中最具活力与广泛应用前景的方向之一。
参考资料
链接:https://neurips.cc/Conferences/2025
本文转载自旺知识,作者:旺知识
