Nature: AI 与人类认知交汇

发布于 2025-7-30 06:43
浏览
0收藏

随着人工智能、认知科学与神经科学的交汇日益加深,业界越来越关注AI模型与人类大脑在表征维度、学习机制以及组织结构方面的共性与差异。

Nature 的四篇文献分别从“表征维度”、“多模态语义对齐”、“层次结构收敛”与“无监督生物预训练”四个方面,共同建构了一个认知框架。

表征维度

“深度神经网络与人类表征对齐的潜在维度”【文献1】,探索了深度神经网络与人类在自然图像概念空间中的映射差异,发现尽管整体行为表现相似,内部“思考”路径上两者存在本质不同。

方法是,首先构建可在 DNN 与人脑间对齐的低维表征框架,之后通过专家评估维度语义或视觉属性。研究表明,DNN 表征明显偏向视觉特征,而人类认知则更倚重语义信息。

Nature: AI 与人类认知交汇-AI.x社区

研究结果揭示了人类与人工智能之间表征对齐面临的重要挑战,有助于厘清表征对齐程度的决定因素的异同,有机会深化对人类认知的理解,以构建更安全、更可靠的AI系统。

多模态语义对齐

“多模态大语言模型中自然涌现的类人物体概念表征”【文献 2】与此相辅相成,研究了大模型能否从语言和多模态数据中形成类人的物体表征。

该研究以 1854 个自然物体为基础,通过470万三元组判断数据构建 66 维嵌入空间,揭示多模态 LLM可自然获得语义聚类结构,并在语义维度上高度可解释,与人类心理表征高度重合。

更为惊人的是,模型嵌入与人类大脑多个功能区(比如 EBA、PPA、RSC、FFA 等)展现出神经活动对齐,表明语义表征不仅限于行为层面,更嵌入脑层结构。

Nature: AI 与人类认知交汇-AI.x社区

这一发现强有力地证明:虽然LLM的物体表征与人类并非完全相同,但二者在反映人类概念知识核心特征方面存在本质相似性。

研究成果既深化了对机器智能的理解,也为开发更具人类特质的认知系统提供了理论依据。

上述两项视觉与语义对齐研究相互呼应:无监督或自监督训练增强了模型低维可解释语义结构,但视觉 DNN 与文本/多模态 LLM 在语义/视觉权重上的差异,也揭示了深度学习系统如何映射不同的认知路径。

层次结构收敛

Nature: LLM变得越来越像大脑​,笔者引述过去年 Nature上的一项工作:“大语言模型与大脑中情境特征提取层级的趋同性”【文献 3】,就对 LLM与人类神经处理机制(尤其是语言理解方面) 的相似性做过深入研究。

Nature: AI 与人类认知交汇-AI.x社区

通过比较多个参数量相近的高性能 LLM各层嵌入与人类语言神经反应的映射能力,发现随着模型性能提升,不仅大模型对脑活动预测更精准,其提取特征的层次结构也与人脑从声学、语音到语义的层级处理路径高度一致。

更进一步的发现是,对话和上下文处理能力不仅提升了 LLM 表征质量,也强化了与大脑语义区的对齐程度,突显“语境”作为桥梁的重要性。

这一趋势与视觉领域中“上下文训练增强语义/风格分离”的结论遥相呼应:无监督和上下文依赖是通向类脑表征体系的关键路径。

无监督生物预训练

人工智能系统在语义与层次结构上不断接近人类认知方式。但人脑自身又是如何形成这些表征的呢?

“生物神经网络中的无监督预训练”【文献4】通过同时记录小鼠初级视觉皮层(V1)和高级视觉区(HVA)中多达90000个神经元的群体活动,对比分析了小鼠在完成多项任务学习时与无奖励刺激暴露状态下的神经活动差异。

研究揭示大脑在未接受监督训练时通过无监督曝光就能大幅重塑神经表征,尤其在HVA 区域,这种自组织机制无需奖励反馈就能形成对视觉输入的有效编码,并在之后的受监督任务中显著加速学习速度。

Nature: AI 与人类认知交汇-AI.x社区

这与现在 AI 无监督或自监督预训练的策略高度相似:预训练阶段构建基础语义或结构表征,监督学习则用于任务微调。论文提出大脑自身也是这样进行“Transformer风格”的预训练:先“看”“听”“预测”,再“做”“分类”“决策”。

表征认知系统

综上可以描绘一个统一的表征认知系统:

无监督预训练作为表征生成底层驱动,视觉 DNN 中的自监督任务帮助抽取低维可解释特征,LLM 在海量语料中学习语义分布,而脑皮层通过不带标签的视觉输入建立高度结构化表征,后续监督学习提升效率。

层次结构收敛使得模型与人脑的表征组织趋同,不论视觉、语言还是多模态理解,高效模型与人脑都习惯于从低级特征逐步构建到高级抽象,这种路径在层次结构层面高度一致。

不同模态中通用,无监督为表征候选提供结构广度,可解释低维为语义表征打基础,层次路径为抽象建模范式提供框架。四篇Nature论文正是这一表征认知系统中不同视角的拼图。

这与笔者梳理的​大模型的数理认知框架​异曲同工:LLM通过重整化感知,范畴构成内部世界模型,变分推断做推理。

Nature: AI 与人类认知交汇-AI.x社区

从认知到行动

四篇文献共同表明:无监督预训练和低维、层次结构化的表征是 AI 与人脑趋同的桥梁。

视觉领域的DNN 与人类在表象层面虽有差异,但语义补偿与无监督机制让多模态语言模型距人类表征结构更近。

语言领域的 LLM 在语境建模中展现出和人脑高度一致的分布路径。而生物神经网络中自然存在的无监督预训练机制,更说明了这一学习路线的生物合理性。

然而AI 模型对人类的“模拟”还局限在认知领域,虽有众多“具身”AI 研究,似乎都还没有触及问题的核心。

Nature: AI 与人类认知交汇-AI.x社区

“人类行为、大脑与深度神经网络中的运动行为可能性表征”【文献5】深入研究了“大脑是如何计算并表征运动行为的可能性”之后发现:

人类大脑视觉区域中的激活模式能够自动地、独立于其他视觉元素(如表面材质和物体)的表征与运动可能性相关的信息,而常用的AI模型——即基于物体和场景分类训练的深度神经网络,并不能很好地表征这类信息。

研究结果表明,场景中的运动行为可能性感知依赖于与其他视觉理解任务不同的专门神经表征机制。

文献1. 《深度神经网络与人类表征对齐的潜在维度》https://www.nature.com/articles/s42256-025-01041-7

文献2. 《多模态大语言模型中自然涌现的类人物体概念表征》https://www.nature.com/articles/s42256-025-01049-z 或 https://arxiv.org/html/2407.01067v3

文献3. 《大语言模型与大脑中情境特征提取层级的趋同性》https://www.nature.com/articles/s42256-024-00925-4 或 https://arxiv.org/abs/2401.17671

文献4. 《生物神经网络中的无监督预训练》https://www.nature.com/articles/s41586-025-09180-y

文献5. 《人类行为、大脑与深度神经网络中的运动动作可供性表征》 https://www.pnas.org/doi/10.1073/pnas.2414005122

本文转载自​​​​​​​​​​​​​清熙​​​​​​​​​,作者:王庆法

收藏
回复
举报
回复
相关推荐