使用Stable Diffusion生成超逼真人脸的三条途径

译文
人工智能
本文介绍了如何使用基本模型生成图像、如何升级到Stable Diffusion XL模型以改善图像质量以及如何使用自定义模型生成高质量图像。

译者 | 布加迪

审校 | 重楼

有没有想过别人是如何使用AI图像生成如此超逼真人脸,而自己的尝试最终却充斥着缺陷失真,看起来明显试着调整了提示和设置,但质量还是无法与看到其他人生图像媲美做错了什么

这篇博文将逐一介绍三项关键技术,开始使用Stable Diffusion生成超逼真的人脸。首先,我们将介绍提示工程的基础知识,帮助使用基本模型生成图像。接下来,我们将探讨如何升级到Stable Diffusion XL模型可以通过更大的参数和训练显著提高图像质量。最后,我将介绍一个专门用于生成高质量图像的自定义模型

1. 提示工程

首先,我们将学习写正面和负面的提示,以生成逼真的人脸。我们将使用在Hugging Face Spaces上提供的Stable Diffusion版本2.1演示。它是免费的,根本不用设置就可以开始入手。

链接hf.co/spaces/stabilityai/stable-diffusion

创建正面提示时,确保包括图像的所有必要细节和风格。在这个例子中,我们想生成一个走在街上的年轻女子的图像。我们将使用基本负面提示,但可以添加额外的关键字,以避免图像中任何重复错误。

正面提示一个20多岁的年轻女子,走在街上,直视镜头,自信而友好的表情,穿着随意,一身现代时尚的服装,城市街景背景,阳光明媚的白天光线,鲜艳的色彩。

负面提示:“外貌丑陋难看,不成熟,卡通,动漫,3D,绘画,卡通,插图,最差质量,低质量”。

我们有一个良好的开端。图像准确的,但图像的质量还有待提高。可以调整提示,但这是从基本模型得到的最好结果。

2. Stable Diffusion XL

我们将使用Stable Diffusion XLSDXL模型来生成高质量图像。使用基本模式生成latent图像,然后使用提炼器对其进行处理,以生成详细而准确的图像。

链接hf.co/spaces/hysts/SD-XL

在生成图像之前,我们将向下滚动并打开高级选项。我们将添加一个负面提示,设置种子,并运用提炼器以获得最佳图像质量。

然后,我们将编写与之前相同的提示,只是做了一些小的更改。我们将生成一个年轻的印度女图像,而不是一个普通的年轻女性的图像

个结果经过了大幅改善。人脸五官完美。不妨尝试生成其他种族的人脸,以检查偏差并比较结果。

我们得到了逼真的脸,但所有图像都有Instagram滤镜。通常,皮肤在现实生活中并不光滑,会有粉刺、斑点、雀斑和皱纹。

3. CivitAIRealVisXL V2.0

这一部分中,我们将生成带有疤痕和逼真皮肤的精致人脸。为此,我们将使用CivitAI的自定义模型RealVisXL V2.0,该模型进行了微调,以获得高质量图像

链接civitai.com/models/139562/realvisxl-v20

可以通过点击创建按钮在线使用该模型,也可以通过Stable Diffusion WebUI下载到本地使用。

先,下载模型并将文件移动到Stable Diffusion WebUI模型目录C:\WebUI\webui\ models\Stable- Diffusion

要在WebUI上显示模型,必须按刷新按钮,然后选择realvisxl20…模型检查点。

们将从编写相同的正面提示负面提示开始入手,生成高质量的1024X1024图像。

张照片看起来很完美。为了充分利用自定义模型,我们必须更改提示。

正面负面提示可以通过向下滚动模型页面并点击喜欢的逼真图像来获得。CivitAI上的图像随带正面负面提示以及先进的转向。

正面提示:“一个印度年轻女子的形象,专注,果断,逼真,动态姿势,超高分辨率,锐利的纹理,高细节的RAW照片,精致的人脸,浅景深,锐利的眼睛,逼真的皮肤纹理1.2,浅色皮肤,DSLR,胶片纹理

负面提示“(最差质量,低质量,插图,3D, 2D,绘画,漫画,素描,张嘴

我们有一个印度女人的详细图像,皮肤逼真。与基本的SDXL模型相比,它是一个改进版。

我们又生成了三个图像来比较不同的种族。结果惊人,包含皮肤疤痕、凹凸不平的皮肤准确的脸部特征。

结论

生成艺术方面的进步将很快达到真实图像和合成图像难以区分的水平。这标志着在将来,任何人都可以利用基于各种现实世界数据训练的自定义模型,简单的文本提示创建高度逼真的可传播媒介。快速的进步意味着令人兴奋的潜力——也许有一天,生成逼真视频可能像输入描述性提示一样简单。

我们在这篇文章中学习了提示工程先进的Stable设计模型和服装微调模型,以生成高度准确和逼真人脸。如果想要更好的效果,建议在civitai.com上探究各种高质量的模型。

原文标题:3 Ways to Generate Hyper-Realistic Faces Using Stable Diffusion,作者:Abid Ali Awan


责任编辑:华轩 来源: 51CTO
相关推荐

2017-05-23 09:10:48

人脸修复鉴别器图像

2016-11-08 17:21:21

大数据安全数据管理

2016-09-27 11:08:22

容器安全

2012-10-22 10:04:11

AMD微型服务器嵌入式

2023-03-06 12:35:45

AI大脑画面图像

2021-09-24 09:00:00

MySQL数据库SQL

2009-04-17 16:20:26

职场迷茫期对策

2009-06-10 10:33:33

华为离职员工定律

2019-12-04 11:16:23

区块链数字货币

2018-07-27 15:20:50

企业新兴技术

2021-08-25 14:58:47

MacOSGreenplumDocker

2023-11-13 14:43:47

API接口

2023-01-10 16:08:04

人工智能扩散模型

2024-02-23 07:10:13

文字渲染Sora人工智能

2023-06-06 07:17:44

云变化管理策略

2014-11-27 10:49:50

AWS re:Inve亚马逊EC2亚马逊

2017-12-08 20:32:39

2011-04-29 11:14:34

投影机

2022-09-19 13:11:56

命令SSH内网穿透

2010-10-20 09:39:50

点赞
收藏

51CTO技术栈公众号