Stable Diffusion 文生图最简流程——重点步骤与参数

重点步骤

主要是4步骤:

1、选择需要使用的模型(底模),这是对生成结果影响最大的因素,主要体现在画面风格上。

Stable Diffusion 文生图最简流程——重点步骤与参数

2、在第一个框中填入提示词(Prompt),对想要生成的东西进行文字描述。

Stable Diffusion 文生图最简流程——重点步骤与参数

3、在第二个框中填入负面提示词(Negative prompt),对不想要生成的东西进行文字描述。

Stable Diffusion 文生图最简流程——重点步骤与参数

4、选择采样方法、采样次数、图片尺寸等参数。

Stable Diffusion 文生图最简流程——重点步骤与参数

参数

知道完大致的步骤后,下面我们来介绍一些重要的参数,选择不同将会带来较大差异:

Sampler(采样器/采样方法)选择使用哪种采样器?

Euler 是最简单、最快的。

Euler a(Eular ancestral)可以以较少的步数产生很大的多样性,不同的步数可能有不同的结果。而非 ancestral 采样器都会产生基本相同的图像。DPM 相关的采样器通常具有不错的效果,但耗时也会相应增加。Euler a 更多样,不同步数可以生产出不同的图片。但是太高步数 (>30) 效果不会更好。

DDIM 收敛快,但效率相对较低,因为需要很多 step 才能获得好的结果,适合在重绘时候使用。

LMS 是 Euler 的衍生,它们使用一种相关但稍有不同的方法(平均过去的几个步骤以提高准确性)。大概 30 step 可以得到稳定结果

PLMS 是 Euler 的衍生,可以更好地处理神经网络结构中的奇异性。

DPM2 是一种神奇的方法,它旨在改进 DDIM,减少步骤以获得良好的结果。它需要每一步运行两次去噪,它的速度大约是 DDIM 的两倍,生图效果也非常好。但是如果你在进行调试提示词的实验,这个采样器可能会有点慢了。

UniPC 效果较好且速度非常快,对平面、卡通的表现较好,推荐使用。

Sampling Steps(采样步数)

Stable Diffusion 的工作方式是从以随机高斯噪声起步,向符合提示的图像一步步降噪接近。随着步数增多,可以得到对目标更小、更精确的图像。但增加步数也会增加生成图像所需的时间。增加步数的边际收益递减,取决于采样器。一般开到 20~30。

不同采样步数与采样器之间的关系:

Stable Diffusion 文生图最简流程——重点步骤与参数

CFG Scale(提示词相关性)

图像与你的提示的匹配程度。增加这个值将导致图像更接近你的提示,但它也在一定程度上降低了图像质量。

可以用更多的采样步骤来抵消。过高的 CFG Scale 体现为粗犷的线条和过锐化的图像。一般开到 7~11。

CFG Scale 与采样器之间的关系:

Stable Diffusion 文生图最简流程——重点步骤与参数

生成批次

每次生成图像的组数。一次运行生成图像的数量为“批次* 批次数量”。

每批数量

同时生成多少个图像。增加这个值可以提高性能,但也需要更多的显存。大的 Batch Size 需要消耗巨量显存。若没有超过 12G 的显存,请保持为 1。

尺寸

指定图像的长宽。出图尺寸太宽时,图中可能会出现多个主体。1024 之上的尺寸可能会出现不理想的结果,推荐使用小尺寸分辨率+高清修复(Hires fix)。

种子

种子决定模型在生成图片时涉及的所有随机性,它初始化了 Diffusion 算法起点的初始值。

理论上,在应用完全相同参数(如 Step、CFG、Seed、prompts)的情况下,生产的图片应当完全相同。

高清修复

Stable Diffusion 文生图最简流程——重点步骤与参数

通过勾选 “Highres. fix” 来启用。默认情况下,文生图在高分辨率下会生成非常混沌的图像。如果使用高清修复,会型首先按照指定的尺寸生成一张图片,然后通过放大算法将图片分辨率扩大,以实现高清大图效果。最终尺寸为(原分辨率*缩放系数 Upscale by)。

放大算法中,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 后就不甚理想。ESRGAN_4x、SwinR 4x 对 0.5 以下的重绘幅度有较好支持。

Hires step 表示在进行这一步时计算的步数。

Denoising strength 字面翻译是降噪强度,表现为最后生成图片对原始输入图像内容的变化程度。该值越高,放大后图像就比放大前图像差别越大。低 denoising 意味着修正原图,高 denoising 就和原图就没有大的相关性了。一般来讲阈值是 0.7 左右,超过 0.7 和原图基本上无关,0.3 以下就是稍微改一些。实际执行中,具体的执行步骤为 Denoising strength * Sampling Steps。

面部修复

修复画面中人物的面部,但是非写实风格的人物开启面部修复可能导致面部崩坏。点击“生成”即可。

Stable Diffusion 文生图最简流程——重点步骤与参数

本文来自腾讯云开发者,不代表ABC.Design立场,如若转载,请注明出处:腾讯云开发者

(1)
打赏 微信扫一扫 微信扫一扫
ABC.Design的头像ABC.Design
上一篇 2023年5月26日 下午12:26
下一篇 2023年5月26日 下午2:06

发表回复

登录后才能评论
交流群
交流群
返回顶部