AI绘世 Tag反推+”隐藏”功能的作用

道法孜然 发表于 2024-3-14 16:08:36

一、图片信息功能
如果你在群里看到一张非常好看的图，也知道它是由Stable Diffusion生成的，想知道如何生成这个图，你可以使用图片信息功能。例如：

![图片信息功能示例](https://assets.example.com/image ... on_info_example.jpg)

这个功能非常简单，所有的提示词、迭代步数、采样方法、尺寸、CFG、seed等信息都显示出来了。而且你还可以一键发送到文生图等其他功能进行二次处理。真的非常方便！

二、Tag反推

如果一张好看的图不是由Stable Diffusion生成的，你可以使用Tag反推功能。这个功能的反推算法非常优秀，上传任何一张图，都能推断出很多提示词。

这个功能生成的Tag非常准确。优先选择wd14-vit-v2-git算法，其他算法在物品识别和Tag准确度上可能略有差异，但wd14-vit-v2-git算法真的是最优秀的。请注意，如果你经常反推Tag，你的显存会加载很多模型，这时就需要点击“卸载显存中所有反推模型”，使得显存占用率降低。

阈值是指提示词占比大于35%的Tag会显示在选出的Tag框里，你可以自由调整这个阈值大小，按百分比来设定。

三、批量操作(Tag反推)

批量操作主要用来给炼LoRa、炼dreambooth、炼embedding或者炼hypernetwork时需要给图片打标签。操作方法与之前类似，设定输入目录，如果想反推这个文件夹里所有的图片，包括子文件夹的图片，可以勾选“全局递归查找”。其他操作都类似，不再详细说明。

四、附加功能——隐藏的大佬

这个附加功能实际上是一个缩放和修复的功能，但名字不那么显眼。一张模糊的照片，使用等比缩放功能，调整缩放比例为4，相当于长度宽度放大了4倍。

如果你的电脑里找不到放大器，需要在设置中勾选放大器选项。

还有一个隐藏的大佬是CodeFormer，它是一个优秀的面部修复算法。它可以使图片变得更清晰，年轻。但它只识别并修复面部，其他背景等部分保持模糊不处理。

高清修复功能实际上也是使用放大算法，例如R-ESRGAN 4X+，将图片放大后再进行局部重绘和重新生成，最后呈现高清修复后的图片。

学习了这些功能后，你会觉得融会贯通了。这些都是基础功能，只有打牢基础，才能更好地解决后续遇到的问题。

页: [1]

ROOT开源's Archiver

AI绘世 Tag反推+”隐藏”功能的作用