
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子 原创
编辑 | 云昭
出品 | 51CTO技术栈(微信号:blog51cto)
好家活!千问这是要干嘛,简直要踢了GPT-5的馆子了!
就在刚刚,小编发现,千问官方X账号“Qwen”宣布:Qwen图像编辑功能重磅上线了!
图片
这次主打三大核心功能:
精准的中英文文本编辑;
高级语义编辑(如:物体旋转、IP 创作);
基础外观编辑(如:添加/删除/插入)ps:小编发现其实还可以替换~
官方还放出了不少unbelievable的玩法。
这里先放上小编心中暗爽的一个用例:用英文提示修改兰亭序中的错别字。
图片
真的是,多模态图像编辑能力被Qwen3玩出了新高度!
看来,大模型对于跨语言语义理解、跨模态编辑、方位识别的能力已经到了可作业的水平。
基础图像编辑功能完全够用,某图秀秀,拜拜
当然,官方的例子不能取代实测的乐趣。
本着新东西马上体验的精神,小编二话不说上手试试了。
首先小编先来测试Qwen3的基础编辑能力。
先把至尊宝的金箍给我摘下来,换掉!
图片
图片
图片
可以看出,基础的一些P图的操作,去除一些配饰,添加新的配饰这样的操作是没问题的。
但问题在于,不能很好的理解中文经典名著里的配饰形状,这也应该是大模型没有相应的训练数据所导致的。
大家P图的时候还经常会有换颜色的需求,小编也试了一下。
上周末小编重温了一集《爱情公寓4》,魏宗万老师的表演真的是绝绝子。
索性顺着吕子乔的那句:小黑看到了一个穿黄色军大衣的老头把花摘走了。
图片
让这位爷爷的大衣改成黄色→
图片
然后,小编想着,摘掉帽子看看当时的魏老爷爷的发际线怎么样。
结果。。。魏爷爷骂人别冲我,冲千问3撒。。乍一看成了宋小宝(哭唧唧)
图片
哈哈~小编还发现一个非常实用的功能:去、水、印!可谓编辑家中必备的工具!
在原来那张图片基础上进一步编辑,去除“腾讯视频独播”的水印,不到半分钟,搞定了~(ps:小编绝对支持正版、这里仅用作功能演示,呼吁大家引用他人素材时,一定要标注来源。)
高级功能来了
千问官方的介绍中,高级语义编辑主打“IP制作”和“旋转”两项。这里先来试一下旋转。
最近《龙族2》动漫上映了,楚子航开着一辆自动驾驶的汽车,但给到的正脸照很少,基本都是侧脸,所以小编直接拿来,给我第一人称视角,变成正脸照。
图片
说改就改,Qwen3真的给力,这长脸虽说跟原片差了一些,但没影响小编对这款神器给到的大拇指!
图片
所以很多影视分镜、包括医学上的图像,未来都可以用上这项功能,真的很赞!
再来看IP制造。
观望中给出了一个非常有趣的例子。围绕16种 MBTI 性格类型设计了一系列编辑提示词。借助这些提示词,他们成功制作了一套基于吉祥物Capybara(ps:千问自家的吉祥物哦)的MBTI主题表情包,从而轻松拓展了这一 IP 的表现力和传播范围。
图片
这个功能就更厉害,相当于我给一张图片,就能生成不同场景、不同姿势、不同表情的素材了。小编赶紧挖掘下。
先给大家一个不是很成功的用例:我让模型一次性生成六种表情包。
本来喂给他一张奥特曼的照片,提示是:分别生成 流泪、悲伤、愤怒、大笑、委屈、无奈 的照片。
结果,表情还都可以,只不过清一色的皱眉、眯眼,差点意思。
图片
但是,不要着急,你可以一张一张地生成表情包,这样给出的图片更有韵味。
比如,小编给他提示:
图片
于是,专属于表情包的快乐发生了——
图片
对了,小编还发现,吉卜力风格,现在 Qwen3 也支持了。
图片
所以,在图像生成和编辑方面,对比ChatGPT和Qwen,小编果断爱上了后者。
因为像常用的去除水印、切换第一人称视角、调整姿势、表情方面,属实是Qwen更得我心。
Qwen3 真的不仅在Coder方面正在追齐GPT、Claude,就连图像编辑方面也开始超越了!
关键还免费,你说还有谁这么大方!
体验地址,小编也扒过来了: https://chat.qwen.ai/
想自己local运行的可以看Github或Huggingface地址:https://github.com/QwenLM/Qwen-Image
https://huggingface.co/Qwen/Qwen-Image-Edit
API地址也扒来了: https://www.alibabacloud.com/help/en/model-studio/qwen-image-edit
好了,期待咱们国产大模型更好的表现!
本文转载自51CTO技术栈,作者:云昭
