Stable Diffusion是一种机器学习模型,它经过训练可以逐步对随机高斯噪声进行去噪以获得感兴趣的样本,例如生成图像。

Stable Diffusion页面简洁明了,包含txt2img, img2img, Extras, PNG Info, Checkpoint Merger, Train, Settings, Extensions八个选项功能。其中前四个功能适合初学者使用,第一个txt2img(即文字生成图像)功能尤为广泛应用。本文将为您详细介绍txt2img。我们网站所附的Stable Diffusion网页链接已设置为中文对照版本,更方便您使用。

屏幕截图 2023-03-02 111327.png

text2img页面

提示词输入方法的详细介绍可见上一篇文章《Prompt提示词输入指南》。

如您是第一次使用该工具,不知如何输入提示词,可点击“例子”选项,再点击“生成”按键查看图片。

屏幕截图 2023-03-02 101211.png

  • Sampling steps:可选择想要的扩散过程的步骤数,采样步数数值越高,图片品质越好,算图时间越久。而数值过低生成的图片质量则差强人意。因此,数值设置在28~50之间为佳。


屏幕截图 2023-03-02 101111.png

  • Sampling method:采样方法不同,生成的图片效果也会有差异,默认情况下,该参数设置为“Euler a”,您可以选择“DPM++”后面的新加入选项,这些会比默认的生成的图片细节内容更加丰富些,一般推荐DPM++ SDE Karras和DDIM。您也可以自行把每一种采样器都试一遍,对比生成的图片效果,根据自己的喜好选择合适的采样器。


屏幕截图 2023-03-02 145006.png

  • Width和Height是图片的宽度和长度,默认512×512,在这个比例下生成的图片效果较好。如需放大图片,我们可以点击附加功能(Send to extras)模块用放大算法进行图片放大。


屏幕截图 2023-03-02 145028.png

  • Batch count:生成图片的批次,增加这个值多次生成图片但生成的时间也会更长(有多图需要建议减少图片生成的批次改为增加单次生成图片的数量参数即可)

  • Batch size:一次生成图片的数量,数量越多,绘图运行时间越长。


屏幕截图 2023-03-02 101249.png

  • CFG Scale:调整图像与你的提示文本的相似度,默认为7,较高的值会使图像更接近于你的提示文本,但过高会让图像色彩过于饱和,数值越小AI绘图发挥的自我空间越大越有可能产生有创意的结果。建议数值设置7~14之间为佳。 


屏幕截图 2023-03-02 101336.png

  • Seed:此参数允许您指定一个随机种子,将用于初始化图像生成过程。相同的种子值每次都会产生相同的图像集,这对于再现性和一致性很有用。如果将种子值保留为-1,则每次运行文本-图像特性时将生成一个随机种子,随机种子够控制生成的样本的多样性。图片生成的种子可以方便用户后续在已生成图片的基础上继续修改图片。


屏幕截图 2023-03-02 145738.png

  • Restore faces:面部修复一般用于远景的脸,不适合特写人像,否则会变模糊。

  • Tiling:用于生成一个可以平铺的图像。

  • Hires. fix:高分辨率修复使用两个步骤的过程进行生成,以较小的分辨率创建图像,然后在不改变构图的情况下改进其中的细节,选择该部分会有两个新的参数Scale latent在潜空间中对图像进行缩放。另一种方法是从潜在的表象中产生完整的图像,将其升级,然后将其移回潜在的空间。

以上就是txt2img的保姆级介绍啦!快来动手试试操作吧!