
AI生成3D一手实测:卖家秀vs买家秀,差一个宇宙 原创
伴随着AI的爆火,用AI生成三维内容(3D AIGC)作为AI的新玩法之一,从今年开始明显受到越来越多的关注。
正是在这样的背景下,LGM(即 Large Gaussian Model,大型多视角高斯模型)由北京大学、南洋理工大学 S-Lab 和上海人工智能实验室的研究者联合提出,旨在依靠一张二维图片,就可5秒生成同款3D物体。
官方给出的卖家秀
LGM现已上线appmall.ai,今天我们就对这款刚刚出品不久的3D AIGC应用进行实测,看看在实际使用中它能为我们带来哪些好玩的体验。
在哪体验LGM?
现在访问appmall.ai,即可通过首页或搜索功能安装LGM,低至2.3元/小时,按分钟计费,无需安装部署,即可一键在线体验。
如何使用LGM?
LGM的操作面板非常简单,左侧功能区可以上传参考图片、输入prompt、调节参数,右侧则直接展示AI基于参考图,建构出来的3D物品。
(1)是否要输入prompt?
经过实测,prompt是否输入并不太影响生成结果。如果输入prompt,那么根据官方给出的实例,也是只需要简单化的内容即可,比如furry fox head,mushroom house这种。
同时,negative prompt可以理解为保证结果水准的外框和标尺,目前默认的设置就是去掉难看、不清晰、像素模糊、不自然色彩、糟糕光线等效果,这项参数保持默认就可以。
(2)下方三项调节参数,要调吗?
elevation(-90 到 90):表示仰角,用于确定观察或生成三维物体的视角垂直方向角度。-90 度代表垂直向下看(俯视),0 度表示水平方向观察(默认值),90 度则是垂直向上看(仰视)。通过设置不同的仰角,可以从不同的垂直角度来生成或查看三维模型,从而满足不同的视觉需求,比如模拟从地面仰望物体或从高空俯瞰物体等场景。
inference steps(1 到 100):推理步骤数,在生成三维物体的过程中,模型需要进行一系列的计算和推理操作来逐步构建出最终的结果。推理步骤数就是控制这个过程的迭代次数。一般来说,步骤数越多,模型有更多的机会对生成的结果进行细化和优化,可能会得到更精确、质量更高的三维物体,但同时也会增加计算时间和资源消耗。如果步骤数太少,可能生成的结果不够理想,存在细节缺失或不准确的情况。
random seed(0 到 100000):随机种子,它是一个用于初始化随机数生成器的值。通过设置固定的随机种子,可以确保在相同的模型参数和输入条件下,每次生成的结果具有一致性和可重复性。如果不设置随机种子或者使用不同的随机种子,那么每次运行模型时,由于随机因素的影响,生成的三维物体可能会有所不同。这样可以方便用户在需要时获取特定的生成结果,也有助于对模型的性能进行评估和比较。
(3)易用性如何?AI小白可以用吗?
界面简单,保持默认参数也能玩,另外在生成时间方面,“5秒出结果”诚不我欺,LGM实测的产出时间确实比其他AI应用都要短。
所以,至少从便捷性、降低AI使用门槛的角度来说,LGM是完全可以达标“易用性”“新手友好”等评价的。
(4)需要上传什么样的参考图?
从实测来看,纯平面图(如二维插画)、主体较多、主体元素较多、图片非高清等情况下,基本上很难达到预期的效果。
纯平面生成
多主体生成
复杂主体生成
(5)生成效果怎么样?
从实测来看,生成效果“买家秀”与官方“卖家秀”的差距还是较大的。可能受制于默认30 steps的限制,LGM的出品并不稳定。
比如在面对毛绒玩具这种其训练过程中高频接触的物品种类时(官方给出的“卖家秀”里有对玩具熊的训练结果),它的表现就还可以。
但是如果换其他材质,在一些清晰化元素(比如五官)的处理上,存在变形。
毕竟LGM发布时间并不长,存在短板是非常正常的事情。我们既不应该盲目追捧某种新生技术,也没有必要将初代水平等同于后续水平而一棒子打死,反而应该客观看待“卖家秀”和“买家秀”的差距、承认可优化空间,这样才能更好地推动AI应用行业的健康长远发展。
当然,LGM完全支持通过调节参数,如增加生成迭代步骤、上传高清参考图等方式,来优化生成结果。这一步就留给广大的AI爱好者去自行发掘吧。
每项3D内容生成之后,LGM也支持将3D内容通过视频的格式进行下载,方便用户后期处理或使用,是不是也不失为一个有趣的AI小工具呢?还在等什么,快来appmall.ai一键体验吧。
