AI绘世 Tag反推+”隐藏”功能的作用
一、图片信息功能如果你在群里看到一张非常好看的图,也知道它是由Stable Diffusion生成的,想知道如何生成这个图,你可以使用图片信息功能。例如:
![图片信息功能示例](https://assets.example.com/image ... on_info_example.jpg)
这个功能非常简单,所有的提示词、迭代步数、采样方法、尺寸、CFG、seed等信息都显示出来了。而且你还可以一键发送到文生图等其他功能进行二次处理。真的非常方便!
二、Tag反推
如果一张好看的图不是由Stable Diffusion生成的,你可以使用Tag反推功能。这个功能的反推算法非常优秀,上传任何一张图,都能推断出很多提示词。
这个功能生成的Tag非常准确。优先选择wd14-vit-v2-git算法,其他算法在物品识别和Tag准确度上可能略有差异,但wd14-vit-v2-git算法真的是最优秀的。请注意,如果你经常反推Tag,你的显存会加载很多模型,这时就需要点击“卸载显存中所有反推模型”,使得显存占用率降低。
阈值是指提示词占比大于35%的Tag会显示在选出的Tag框里,你可以自由调整这个阈值大小,按百分比来设定。
三、批量操作(Tag反推)
批量操作主要用来给炼LoRa、炼dreambooth、炼embedding或者炼hypernetwork时需要给图片打标签。操作方法与之前类似,设定输入目录,如果想反推这个文件夹里所有的图片,包括子文件夹的图片,可以勾选“全局递归查找”。其他操作都类似,不再详细说明。
四、附加功能——隐藏的大佬
这个附加功能实际上是一个缩放和修复的功能,但名字不那么显眼。一张模糊的照片,使用等比缩放功能,调整缩放比例为4,相当于长度宽度放大了4倍。
如果你的电脑里找不到放大器,需要在设置中勾选放大器选项。
还有一个隐藏的大佬是CodeFormer,它是一个优秀的面部修复算法。它可以使图片变得更清晰,年轻。但它只识别并修复面部,其他背景等部分保持模糊不处理。
高清修复功能实际上也是使用放大算法,例如R-ESRGAN 4X+,将图片放大后再进行局部重绘和重新生成,最后呈现高清修复后的图片。
学习了这些功能后,你会觉得融会贯通了。这些都是基础功能,只有打牢基础,才能更好地解决后续遇到的问题。
页:
[1]