极客时间-轻松学习，高效学习-极客邦

peter
2023-08-04 来自北京
请教老师两个问题： Q1：那个1000步是怎么来的？经验值吗？ Q2：假如我要写采样器的论文，可以从哪些方面推出新的采样器？
作者回复: 你好。针对Q1，1000步是经验值，实际扩散模型训练过程中这个参数可以调整。针对Q2，我觉得关于采样器有两个方向需要继续研究：更少的采样步数（比如2-3步出图），这部分已经有一些论文了；处理特定的挑战，比如大数据、高维度、异常值等进行特殊设计（需要先分析已有采样器在复杂场景下的差异和优劣）。希望能帮助到你。
1
王大叶
2023-08-31 来自北京
仔细观察你会发现，采样器与 UNet 模型的能力是不冲突的。这便解释了为什么在 WebUI 中我们使用同样的 AI 绘画模型，却可以任意选择采样器。 ---- 这里不太理解，为什么采样器和 Unet 模型的能力不冲突？老师可以稍微多解释一下吗？
作者回复: 你好。要彻底搞懂这个问题需要很多的数学知识。简言之，UNet模型预测的目标是一个符合高斯分布的噪声，从训练过程我们可以知道，这个噪声是我们随机生成的，也我们去噪要用的采样器无关。采样器本质上是我们预先设定一个噪声去除方案，比如30步去噪得到一张清晰图片。不同采样器背后的数学原理不同，但本质上，都是以时间步t、当前时间步t的带噪图像和UNet预测噪声值作为输入，按照预定的去噪方案去抹除一个高斯噪声。
和某欢
2023-08-20 来自四川
请教老师一个问题，文中说有些采样器是执行一步，内部间隔的时间步是50步。这里间隔的时间步是怎么得出的呢？有没有间隔时间步是1000步的呢？只需要计算一次就可以出图
作者回复: 你好。更快的采样器也是当前研究的热点方向。据我所知，当前有一些论文中提出过少于10步的采样算法，但实际应用并不多。1步出图是最终目标，也是理想形态。至于间隔步的计算，比如我们训练过程总的加噪步数是1000，推理的时候指定采样步数是20，那么相当于一次去除了1000/20=50步的噪声。希望能帮助到你。
石云升
2023-08-04 来自广东
如果采样器都差不多，为啥webuI有10几个这么多。除了老师总结的几个用法外，还有没有更具体的区别？我的理解是，应该是某个采集器解决不了某个场景的问题，才会有人去研发一个新的采集器。
作者回复: 你好。我个人的看法是，采样器研究的终极目标是希望采样过程又快又好。在不同的应用场景或数据类型下，采样器设计和性能确实会有所不同，只不过在我们简单prompt场景下的AI绘画任务上差别不明显。未来采样器方向，我觉得有两个方向需要继续研究：更少的采样步数（比如2-3步出图），这部分已经有一些论文了；处理特定的挑战，比如大数据、高维度、异常值等进行特殊设计。其中第二个方向上我和你的看法是一致的。