"Localizing Object-level Shape Variations with Text-to-Image Diffusion Models" Arxiv, 2023 Mar paper code pdf Authors: Or Patashnik, Daniel Garibi, Idan Azuri, Hadar Averbuch-Elor, Daniel Cohen-Or
去噪阶段,使用不同提示。类似感知方式理解去噪过程,扩散去噪一开始全是噪声只有轮廓信息,之后学细节。
分为 3 个阶段,$T \to T_3$ 控制图像布局;$$
ablation study 看那个模块有效,总结一下
learn what & how to apply to our task
diffusion 去噪过程分阶段,修改不同 condition