
超材料设计破局!Meta AI等提出UNIMATE,首次实现拓扑生成/性能预测等任务的统一建模 原创
超材料是一类由人工设计的亚波长结构组成的材料,能够突破天然材料的固有限制,实现对电磁波的精确调控,如负折射率、超透镜、隐身技术等。其中,机械超材料作为一类拥有特殊力学性能的人造材料,在航空航天、生物医药、能源存储等多个领域展现出巨大的应用潜力。其独特之处在于性能并非由材料的化学成分决定,而是通过精心设计的微观结构来实现。例如,具有负泊松比的超材料在拉伸时会横向膨胀,这种特性使其在柔性器件中具有重要应用价值;而具有高能量吸收行为的超材料则适用于缓冲装置。
在材料科学与人工智能交叉领域,超材料的设计与优化一直是备受关注的研究方向。在机械超材料的设计过程中,通常涉及三个关键模态:3D 拓扑结构、密度条件和力学性能。这三个模态之间存在着密切的关联,已知其中任意两个模态,就可以推导出第三个模态。然而,研究团队通过全面回顾现有文献发现,大多数已有研究仅考虑其中两个模态。例如,给定 3D 拓扑结构预测力学性能,或者根据所需性能生成 3D 拓扑结构。这种局限性使得现有的机器学习模型在处理复杂的实际应用场景时面临挑战,难以全面捕捉三个模态之间的完整关系。
为了填补这一研究空白,来自美国弗吉尼亚理工学院和 Meta AI 的研究团队提出了一种名为 UNIMATE 的统一模型,首次构建了能够同时处理超材料设计三大模态的统一框架,通过模态对齐与协同扩散生成的创新架构,实现了拓扑生成、性能预测和条件确认三大任务的协同优化。该研究不仅填补了多任务超材料设计的技术空白,更为智能材料发现提供了通用方法论。
研究成果以「UNIMATE: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation」为题,入选 ICML 2025。
研究亮点:
* 跨任务泛化性:单一模型同时解决三大任务,突破传统模型的任务局限性;
* 模态对齐有效性:通过 TOT 和码本量化,显著缩小异构数据的分布差异;
* 工程实用性:高效的内存管理和参数敏感性,适用于实际材料设计场景。
论文地址:
UniMate 机械超材料基准数据集:
数据集:首个涵盖多任务的机械超材料基准数据集
针对现有数据缺乏多模态覆盖的问题,UNIMATE 团队基于 Lumpe & Stankovic(2021)的拓扑结构,构建首个包含了三维拓扑、密度条件和力学性能的统一数据集,从 17,087 个原始拓扑中筛选 500 个节点数不超过 20 的拓扑结构。
对于每个拓扑结构,研究团队随机分配 3 种不同的边缘半径,并且为每个拓扑结构生成了 3 种不同的密度条件(通过边缘半径与等效边长公式关联)。
对于每个拓扑 - 密度对,研究团队将 3D 结构划分为小的立方体素,然后应用均匀化模拟来计算结构的均匀化力学性能,包括杨氏模量、剪切模量和泊松比等。最终得到 1,500 个数据点(500 个拓扑结构,每个拓扑结构对应 3 种密度及相应的性能)。
为了进一步增强数据集的多样性,研究团队对每个数据点进行了数据增强,通过将拓扑结构和性能以相同的随机旋转角度进行旋转,每个数据点旋转 9 次,最终使数据集包含 15,000 个样本,覆盖低密度(ρ=0.1)到中密度(ρ=0.5)场景,拓扑结构满足立方对称性和周期性。
模型架构:模态对齐模块和协同扩散生成模块
UNIMATE 模型架构旨在解决机械超材料设计中三维拓扑(3D Topology)、密度条件(Density Condition)和力学性能(Mechanical Property)三大模态的统一建模问题,其核心由模态对齐模块(Modality Alignment Module)和协同扩散生成模块(Synergetic Diffusion Generation Module)组成,如下图所示,并通过训练与推理流程实现多任务协同处理。
模型架构图
模态对齐模块:统一多模态潜在空间
该模块的目标是将 3 种异构模态(拓扑结构、密度、力学性能)映射到共享的离散潜在空间(discrete latent space),通过三方最优传输(Tripartite Optimal Transport, TOT)对齐模态分布,缩小模态间差异,解决数据复杂性挑战。
具体来说,受 VQ-VAE 的启发,该模块首先将原始数据映射到离散的潜在空间。对于三维拓扑结构,使用图卷积网络(GCN)作为编码器,将拓扑结构的节点坐标和邻接矩阵转换为潜在嵌入;对于密度条件和机械性能,则分别使用多层感知机(MLP)作为编码器。
然后,引入一个码本(codebook)来 「舍入(round)」 潜在 token ,即找到码本中最接近的原型 token ,并将潜在 token 替换为该原型 token 。这样可以将 3 个不同的模态映射到一个由一系列 token 组成的共享离散空间。
为了对齐这 3 个模态,研究团队将最优传输(OT)推广到三方最优传输(TOT),通过最小化三方 Wasserstein 距离(TWD)来优化潜在 token 的分布,从而实现 3 个模态的对齐。对齐损失函数的设计综合考虑了重建误差、 token 舍入误差和模态对齐误差等因素。
协同扩散生成模块:灵活处理多任务
协同扩散生成模块基于分数的扩散模型(a score-based diffusion model),利用模态对齐后的 token 完成未知模态的生成,支持灵活的条件生成,应对任务多样性挑战。
该模块的输入是「舍入」后的潜在机械超材料(LMTR),其中部分 token 被添加噪声,并视为未知 token 。扩散过程通过一系列去噪步骤来完成对未知 token 的生成,每个步骤都使用 Transformer 作为主干网络。
为了保持给定的上下文 token 不变,Transformer 主干网络执行部分冻结的扩散操作,即对于输出中的已知 token ,用其初始值替换。这种部分冻结的处理方式使得模型能够处理任意长度的 token 序列,并且可以将任意子集的 token 设置为未知,已知 token 为其他 token 提供了上下文信息,尤其是在 Transformer 的注意力操作中。
生成损失函数定义为舍入后的 LMTR 与扩散生成的 LMTR 之间的距离,通过最小化该损失函数来优化生成过程。
训练阶段交替执行模态对齐与协同扩散训练,首先通过编码器和码本将原始数据映射为潜在 token,利用 TOT 对齐模态;然后对随机模态添加噪声,通过扩散模型进行去噪训练,优化整体损失。
推理阶段给定部分模态数据(如密度和性能),通过对应编码器生成已知潜在 token,未知 token 通过传输计划 TransPlan 初始化(高概率 token 优先),再经扩散模型生成完整潜在 token 序列,最终由解码器重构为原始模态数据。
实验结论:三大任务性能全面提升
有效性分析
为了验证 UNIMATE 模型的有效性,研究团队进行了全面的实验,在拓扑生成、性能预测和条件确认三个任务上与多个基线模型进行了对比。
在拓扑生成任务中,UNIMATE 的 Fqua 和 Fcond 指标分别达到 2.74×10⁻² 和 7.81×10⁻²,较次优基线模型 SyMat 提升 80.2%。这意味着生成的拓扑结构在对称性、周期性等关键几何特征上更接近工程实用标准。
在性能预测任务中,UNIMATE 的 NRMSEpp 为 2.44×10⁻²,比排名第二的模型高出 5.1%。
在条件确认任务中,UNIMATE 的 NRMSEcc 为 4.43×10⁻²,比次优模型高出 50.2%。此外,UNIMATE 还能帮助工程师确定给定拓扑与性能要求下的最优密度,能够在保证性能的前提下,将结构重量降低 30% 以上。
时间和空间效率
在时间效率方面,通过训练每个模型并记录处理每个批次的平均时间。结果表明,每个模型的 batch 处理时间与 batch 大小大致呈线性关系,如下图所示。UNIMATE 模型的斜率处于中等水平,表明其具有中等水平的时间效率。
时间效率对比
在空间效率方面,许多基线模型在较小的 batch 大小下会由于 GPU 内存不足而触发错误,而 UNIMATE 模型即使在 batch 大小为 10,000 时也没有触发错误,显示出其远高于其他模型的空间效率。
参数敏感性
研究团队还研究了模型对潜在 token 维度 d 和码本中 token 数量 n 的参数敏感性。实验结果如下图所示,随着潜在 token 维度的增大和码本大小的增加,模型的性能通常会更好。
不同参数下的 Fqua 指标
案例研究
为了展示 UNIMATE 模型的实际应用,研究团队进行了一个针对高刚度和低密度(HSLD)超材料的拓扑生成案例研究。在训练模型时,从原始数据集中筛选出表现出更好 HSLD 特性的超材料数据,将密度条件限制在较低值(如 0.3),并将所需刚度调整在一定范围内(如 0.1 至 0.5)。
实验结果表明,UNIMATE 模型能够生成随着性能变化的拓扑过渡系列。在 HSLD 目标任务中,模型建议使用八面体桁架拓扑(octet truss topology),这是一种已知的高刚度拓扑候选。此外,模型还能生成训练数据集中未包含的新颖中间拓扑,这表明其具有在给定分布内近似中间过渡的潜力,并能够提出具有所需性能的新型超材料候选。
机器学习算法赋能,开启机械超材料设计新征程
随着机器学习的深度介入,机械超材料设计的固有范式正在被改写。在学研领域,围绕机械超材料的研究持续升温,学者们通过挖掘材料结构数据与性能参数的复杂关联,结合神经网络的非线性拟合能力,正逐步解决高自由度超材料设计中计算量大、复杂性导致的观测表征难、设计空间参数繁多等挑战。
例如,美国宾夕法尼亚州立大学等团队提出将一种新颖的固定注意力机制引入深度学习框架,以解决超材料设计的计算难题。该超材料由两根金纳米棒嵌入电介质基底构成,通过 12 个参数描述其结构。实验利用 Lumerical FDTD 仿真生成 6,493 组数据训练网络。结果显示,相比无注意力机制的网络,该方法预测精度提升 48.09%,测试集均方误差达 2.17×10⁻³,且计算速度大幅提高。此外,该框架还能应用于等离子体超材料的逆向设计,显著降低了计算成本,为高效实时优化复杂纳米结构开辟了道路。
* 论文地址:
https://arxiv.org/abs/2504.00203
与此同时,大西洋国际大学团队提出了一种基于人工智能的新型超材料观测装置,将现代成像硬件与尖端机器学习算法相结合。与传统的观测技术相比,该系统在精度、速度以及探测迄今为止无法探测到的元素的能力方面均有显著提升。结果表明,人工智能驱动的方法不仅提高了定义已知超材料的能力,还开辟了寻找独特特性和行为的新途径,从而加速材料科学与工程领域的发明速度。相关研究已入选 International Journal of Futuristic Innovation in Engineering, Science and Technology (IJFIEST) 期刊。
* 论文地址:
https://journal.inence.org/index.php/ijfiest/article/view/369
此外,首尔国立大学等团队提出了一种三维机械超材料无参数设计策略,其基于点云的深度生成网络,构建了超材料结构库来训练机器学习模型。训练后的潜在空间形成具有相似特性的单元拓扑簇,从而实现高效的探索和平滑的插值。此外,与传统方法相比,该方法可以更快地预测机械特性。该方法创建了具有目标特性的超材料,不受参数化约束的限制。计算和实验验证证实,其与期望特性在可接受的误差范围内一致。
* 论文地址:
https://arxiv.org/abs/2411.19681
可以预见,机器学习算法正推动机械超材料的设计与应用迈向新高度。随着强化学习、生成对抗网络等算法的持续迭代,机器学习有望为机械超材料领域带来更多颠覆性突破,助力其在更多领域实现广泛应用。
参考链接:
https://mp.weixin.qq.com/s/-LTTHsvIz-x9p0zjT6I1kg
https://arxiv.org/abs/2411.19681
https://arxiv.org/abs/2504.00203
