快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅 精华

发布于 2024-6-26 09:30
浏览
0收藏

最近,可灵AI直接让一位网友的家人群里炸锅了……


事情是这样的,这位网友的父亲需要做搭桥手术,为了给父亲鼓舞,他便试着用可灵AI把爷爷的两张老照片还原成了视频。


在下面这个视频中,爷爷正在朝鲜战场,担任营指导员。穿越时光隧道,1950年代风华正茂的爷爷,对着他挥了挥手。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区


这位网友把视频发到家人群后,群里直接炸了!

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

下面这张黑白的合影,是全家唯有的一张全家福。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

当已经故去的人忽然动了起来,音容笑貌一如往昔,每个人都泪目了。


快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区


家人们久久不能平静,即使已过午夜,群里仍然不断有消息响起。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

用AI还原老照片后,全家人仿佛一起经历了一场寻根之旅,从长辈口述的「家史」中,每个人都获得了更多的自我身份认同感。


网友「珏哥」在他的公众号「觉得有意思」里表示,在他看来,AI最大的意义就是成为一台超级造梦机器:安排自己做个美梦,一觉醒来就有继续去生活的劲头了。

歪果仁都「馋哭了」

是的,这几天快手可灵最新上线的图生视频和视频续写功能,不仅在国内掀起一波试用的热潮,还「馋哭」了一众外国网友。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

如今,X上已经铺满了可灵生成和续写的视频。


比如这张著名的经典表情包,经过可灵的续写后终于有了大结局!

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

每一步都在意料之外,但似乎又在情理之中(手动狗头)


狗狗吃面也变得活灵活现。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

要知道,曾经的快手可灵一出世,就让外国网友们发出心悦诚服的感叹:效果居然比Sora还要好!

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

同样是吃汉堡,可灵生成的「咬痕」就要比Sora更加逼真

一些申请到试用资格的用户纷纷表示「真香」。而那些不能亲自体验的国外网友,纷纷「跪求」帮忙生成。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

可以说,可灵给全世界的开发者们,再次带来了来自中国的亿点点震撼!

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

作者:温维斯Wenvis

值得一提的是,由于太过爆火,快影App截至目前已有累计超过20万人排队申请。

所以说,这次可灵的两大全新功能,究竟强大在哪里?

图生视频

首先来看第一个功能——图生视频。


这一功能直接做到了化静为动,让我们从此可以按需定制视觉叙事。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

可灵在文生视频上的诸多强大功能,也被一一完美融入了,比如创造逼真的运动场景、精确模拟物理特性、将复杂概念巧妙融合、输出电影级画质、自由调节视频纵横比等等。


上传一张图片,接下来,就是奇迹出现的时刻。


永远面带谜之微笑的蒙娜丽莎,竟然戴上了墨镜,瞟向观众们的小眼神,更多了一丝调皮和狡黠。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

prompt: 蒙娜丽莎用手戴了眼镜

构建复杂时空一绝

业内都知道,模型在转换静态图像为动态视频时,如何细腻而准确地实现大幅度运动场景,要克服不少难点。


对此,可灵充分利用了基础模型架构中的3D时空联合注意力机制,在构建复杂时空运动方面,表现令人惊叹。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

下面这个由静图生成的牧羊犬追球的视频,自然流畅,效果非常丝滑。


无论是牧羊犬一下一下晃动的耳朵,还是随风飘扬的毛发,看起来都很符合物理规律。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

prompt: 可爱的牧羊犬在奔跑,网球在弹跳,温馨的氛围


汽车在公路上飞驰的这段视频,可灵对整体画面的处理效果简直堪称广告级大片。


不仅汽车疾速前行的姿态逼真自然,对向车道上接连不断的车流、道路两旁向后掠去的树木、虚化处理的隔离带,无不模拟出了疾驰的速度感,几乎挑不出破绽。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

prompt:汽车在公路上高速行驶,速度感,广告片

文本指令控制视频,女孩一键转身

更厉害的是,可灵的图生视频模型还融入了强大的提示词融合技术。


这就意味着,用户可以对模型下达文本指令,来人为地掌控视频中对象的动态表现了。


比如上传这张女孩的照片后,普通的模型,可能会默认增加发丝飘动、花朵摇曳、水面闪烁波纹的效果。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

但在可灵中,我们可以输入「转身背对镜头」的提示词。


模型输出的视频中,女孩就开始优雅转身,并且增添了转身瞬间微笑、眨眼的细节,显得更加自然生动。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

可灵的这个新功能,也让我们的想象力可以充分放飞。


比如小编在看《权力的游戏》时经常想象的一个场景——「愤怒的巨龙,漫天飞沙,奇幻风格电影」,提示词输入后,幻想中的场景瞬间成真了!


巨龙昂首展翅,掀起漫天黄沙,咆哮声震耳欲聋

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

这种文本与图像意义的紧密联动,无疑对影视制作等行业意义重大。(看来好莱坞导演撤掉8亿美元摄影棚,的确是明智的选择)


从此,视觉叙事可以按需定制,许多行业必将掀起新的飓风。


此外,这个模型还能支持不同风格的图像输入,无论自然写实,还是风格化图像。


同时,它还兼容各种长宽比的图像输入,可以说是为国内各个短视频平台量身打造。

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅-AI.x社区

这张竖版的骑士,黑袍飞舞,光剑仙气环绕,氛围感瞬间拉满

实测效果

凭AI电影《山海奇境》刷屏全网的制作人陈坤,半年之后用可灵的图生视频功能重制了一遍《山海奇镜》的预告片。


留言区的网友直呼「有大片的味道」。果然AI一天,人间一年。


本文转自新智元,作者:新智元


原文链接: ​​https://mp.weixin.qq.com/s/8hYkf-By4tHw0iowWK8UIQ​

标签
收藏
回复
举报
回复