鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元

发布于 2025-7-8 06:23

浏览

0收藏

由南洋理工大学推出 Sparc3D 是一个统一的框架，它将稀疏可变形行进立方体表示Sparcubes与新型编码器Sparconv-VAE相结合。Sparcubes 通过将有符号距离和变形场散射到稀疏立方体上，将原始网格转换为具有任意拓扑的高分辨率 (1024³) 表面，从而实现可微分优化。Sparconv-VAE 是第一个完全基于稀疏卷积网络构建的模态一致性变分自编码器，能够通过潜在扩散实现高效且近乎无损的三维重建，适用于高分辨率生成建模。

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

相关链接

论文：https://arxiv.org/abs/2505.14521
试用：https://huggingface.co/spaces/ilcve21/Sparc3D
主页：https://lizhihao6.github.io/Sparc3D/
生产平台：https://hitem3d.ai/

VAE 重建结果

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

图像到 3D 生成结果

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

论文介绍

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

由于网格数据的非结构化特性以及密集体积网格的立方复杂性，高保真 3D 物体合成比 2D 图像生成仍然更具挑战性。现有的两阶段流程——使用 VAE（使用 2D 或 3D 监督）压缩网格，然后进行潜在扩散采样——通常会因 VAE 中引入的低效表示和模态不匹配而导致严重的细节丢失。

论文推出了Sparc3D，这是一个统一的框架，它将稀疏可变形行进立方体表示Sparcubes与新型编码器Sparconv-VAE相结合。Sparcubes 通过将有符号距离和变形场散射到稀疏立方体上，将原始网格转换为具有任意拓扑的高分辨率（1024 3）表面，从而实现可微优化。 Sparconv-VAE 是首个完全基于稀疏卷积网络构建的模态一致性变分自编码器，能够通过潜在扩散实现高效且近乎无损的 3D 重建，适用于高分辨率生成建模。Sparc3D 能够在挑战性输入（包括开放表面、不连续组件和复杂几何形状）上实现一流的重建保真度。它能够保留细粒度的形状细节，降低训练和推理成本，并与潜在扩散模型自然集成，实现可扩展的高分辨率 3D 生成。

方法概述（Sparcubes）

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

Sparcubes 重建管道的图示，用于将原始网格转换为防水网格。

方法概述（Sparconv-VAE）

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

Sparconv-VAE 包含一系列稀疏卷积块，并集成了源自 Point Transformer V3 的轻量级局部注意力模块。

实验结果

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

VAE 重建的定性比较。Sparconv-VAE 在重建复杂几何形状、将开放表面转换为双层水密网格以及揭示不可见的内部结构方面表现出色。

南洋理工力作Sparc3D：开启三维重建可微分优化与高效生成新纪元-AI.x社区

单幅图像到三维生成的定性比较。在相同的架构和模型大小下，使用 Sparconv-VAE 训练的生成器比 TRELLIS 生成了更详细的重建结果。

结论

Sparc3D 是一个统一的框架，旨在解决 3D 生成流程中长期存在的两个瓶颈：保持拓扑结构的网格重构和模态一致性的潜在编码。其核心是 Sparcubes，它将原始的非水密网格转换为高分辨率的完全水密表面，同时保留精细的细节和微小的组件。在此基础上，Sparconv-VAE（一个带有自剪枝解码器的稀疏卷积变分自编码器）直接压缩和重构稀疏表示，而无需借助重量级注意力机制，从而实现了最佳的重建保真度和更快的收敛速度。当与潜在扩散（例如 TRELLIS）结合使用时，Sparc3D 可以提升下游 3D 资产合成的生成分辨率。总之，这些贡献为虚拟（AR/VR、机器人模拟）和物理（3D 打印）领域的高保真 3D 生成建立了强大、可扩展的基础。

本文转载自AIGC Studio，作者：AIGC Studio

标签

赞

收藏

回复

举报

回复

相关推荐

CVPR 2024满分论文解读：基于可变形三维高斯的高质量单目动态重建新方法

kcoufee • 3965浏览 • 0回复
大连理工卢湖川、贾旭团队提出可插入图像/视频/3D生成的StableIdentity

angel • 3439浏览 • 0回复
借助神经结构光，浙大实现动态三维现象的实时采集重建

轻薄滴假象 • 3547浏览 • 0回复
CVPR 2024 Highlight | 基于单曝光压缩成像，不依赖生成模型也能从单张图像中重建三维场景

轻薄滴假象 • 3713浏览 • 0回复
高效、可泛化的高斯重建框架，只需3张视图即可快速推理，45秒便可完成优化

轻薄滴假象 • 3424浏览 • 0回复
天大、南大发布LPSNet：无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

duhorse • 3362浏览 • 0回复
YOLO-NAS：开启实时目标检测新纪元

sword_hero • 4355浏览 • 0回复
高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF

轻薄滴假象 • 3744浏览 • 0回复
全新发布：LangGraph开启认知架构新纪元

ermulong • 7160浏览 • 0回复
麻省理工创新模型：用2D视频扩散，生成 3D 视频

Aceryt • 4134浏览 • 0回复
多模态-故障诊断 | 大核卷积开启视觉新纪元!

Tang_Lan • 5460浏览 • 0回复
3D生成基础模型来了！只需5秒，高质量3D资产规模化生成！南洋理工等重磅开源3DTopia-XL

angel • 3538浏览 • 0回复
多模态-故障诊断 | 大核卷积开启视觉新纪元!

Tang_Lan • 4155浏览 • 0回复
Emu3：开启多模态人工智能新纪元 —— 视频、图像、文本三合一模型

穿越时空111 • 3773浏览 • 0回复
OpenAI Sora震撼登场：20秒打造专业级视频，开启创意新纪元！

十一月雨_55 • 3101浏览 • 0回复
开启AI短剧新纪元!SkyReels-V1/A1双剑合璧!昆仑万维开源首个面向AI短剧的视频生成模型

angel • 5515浏览 • 0回复
GPT-5 发布：长文本、多模态与代码生成的新纪元

mb686ba423d8aa5 • 3206浏览 • 0回复
ICML'25南洋理工+阿里：反事实RL实现VLM智能体高效在线调优，成功率涨12%

十一月雨_55 • 4301浏览 • 0回复
阿里通义Qwen3-Omni：终结AI模态壁垒，开启实时智能新纪元

草台AI • 1098浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

AIGC 进入「长剧情」时代！复旦&微软开源StableAvatar: 首个端到端无限时长音频驱动人物视频生成新框架! 2025-09-29 07:19:22发布
ICCV 2025 | Meta LeCun 团队发布DINO-World：基于隐空间仅 1/12 参数量实现SOTA视频预测 2025-09-29 06:59:31发布

热门推荐

AIGC 进入「长剧情」时代！复旦&微软开源StableAvatar: 首个端到端无限时长音频驱动人物视频生成新框架! 0回复

Qwen3-Omni-30B-A3B-Instruct 部署实战保姆及教程（图片、语音、视频全模态识别） 0回复

2025年五大本地大模型，程序员必看！ 0回复

阿里通义重磅开源 DeepResearch：让 AI 具备 “人类级研究能力” 的技术架构全景解析 0回复

Cursor 1.3 ~ 1.6 版本更新全梳理：终端不再挂、Agent 更聪明、上下文更可控 0回复

上一篇：重磅！黑森林实验室开放 FLUX.1 Kontext [dev]权重，120 亿参数黑科技，重塑图像编辑格局！

下一篇： AI生成电影新革命！字节&港中文等提出Captain Cinema，当「无限记忆」打破〈盗梦空间〉的第四面墙

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载