
AI教母李飞飞团队发布最新空间智能模型!一张图生成无限3D世界,元宇宙越来越近了 原创
今天,斯坦福大学教授李飞飞初创的 World Labs 公司发布了名为 Marble 的空间智能模型测试版,仅凭一张图片或文本提示就能生成持久存在、可无限探索的 3D 世界。这意味着用户可以通过简单输入,创建出规模宏大、风格多样、几何结构清晰的虚拟环境,并能自由导航探索。
与以往的 3D 生成技术最大的区别在于,Marble 创建的 3D 世界具有持久性和一致性。用户生成的场景不会随时间变化或出现变形,而且可以通过组合多个生成结果来构建更庞大的世界。对于游戏开发者来说,利用该技术可以构建出连续而连贯的虚拟空间,从而为后续的游戏开发开辟新的可能性。
技术层面,Marble表现出以下三大核心优势:
几何结构:提供比深度图或点云更丰富的几何复杂性,使用户能够探索输入视角之外的隐藏空间;
风格多样性:模型能够处理从扁平卡通到写实风格的各种输入内容;
世界规模:借助模型的一致性和风格保持能力,用户可以将多个场景拼接成更宏大的环境。
应用生态方面,World Labs 提供了完整的创作管道。用户可以将生成的世界导出为高斯点云,并利用开源的 Spark 渲染库将其集成到 Three.js 中,构建基于网页的 3D 体验。这意味着生成的内容能够在台式机、笔记本、移动设备和 VR 头显上实现高效渲染,大大降低了创作门槛。
李飞飞将空间智能视为人工智能发展的关键方向。在她看来,这种技术能够使 AI 不仅看到和理解世界,还能学习并采取行动。这种能力对于机器人技术、自动驾驶和增强现实等需要与 3D 世界互动的具身智能系统至关重要。
与谷歌 Genie 等生成模型相比,Marble 的独特之处在于其生成的世界是永久持续的。用户可以随时访问已创建的世界,没有时间限制,且完全免费。这一特点使得 Marble 更适合构建持久的虚拟环境,而不是短暂的体验。
Marble 现已开放限量测试,用户可以通过 World Labs 官网申请访问权限。
不得不感叹,AI 技术发展的速度太快,随着李飞飞团队 Marble 模型的出现,我们离元宇宙的实现似乎又近了一步——尽管 Marble 目前仍存在一定的局限。该模型主要专注于环境创建,而非单个对象或人物。此外,生成世界的规模虽然已经超出房间尺度,但距离真正的无限世界还有差距。
元宇宙的实现,并非一朝一夕的事,但这项技术很可能为其奠定关键的基础设施。元宇宙作为一个与现实世界持久、稳定连接的数字世界,需要多种技术支撑。Marble 解决的内容生成和一致性挑战,正是构建沉浸式虚拟环境的关键障碍。
自元宇宙的概念第一次被提出,到如今数字技术发展至新的阶段,它与 AI 技术共同构成了「沉浸式数字世界」的核心支柱。
【图片由AI生成】
回顾 AI 爆发的数十年,就像一部充满雄心、挫折与突破的史诗。从 AlexNet 在 ImageNet 图像识别竞赛中夺冠,开启深度学习革命,到 AlphaGo 击败世界围棋冠军,改变人们对 AI 能力的认知,再到 ChatGPT 的问世,AI 的一次次突破,不断刷新着我们的想象。
如今,远程办公和线上社交逐渐成为常态,年轻一代在数字世界中表达自我、建立身份的需求也日益显著。技术迭代、云计算支撑与需求升级,正持续推动元宇宙从概念走向现实。
未来,空间智能技术的发展可能会重新定义我们与数字世界交互的方式。同时,在算力支撑下,生成式 AI 在 3D 内容创建方面不断进步,我们可能正在走向一个每个人都能轻松创建和共享虚拟世界的未来。
