Diffusion model(一):公式推导详解

2023-03-14 paperreading python, pytorch 0 评论字数统计: 1.5k(字) 阅读时长: 5(分)

前言

本文一共分为三大部分，这是第一部分

Diffusion model(一): 公式推导详解
 Diffusion model(二): 训练推导详解
 Diffusion model(三): 公式结论

首先附上几个大佬的讲解
lilianweng-diffusion-models
zhihu_由浅入深了解Diffusion Model
b站_diffusion model 原理讲解
 b站_基于 pytorch 动手实现 diffusion model
DDPM论文_NIPS_2020

这篇博客借鉴了上述博客、视频以及DDPM论文，同时加上个人的理解整合了一下，尽可能让整个推导详细，希望能使每个人都看懂

结合之前讲过的VAE和GAN模型，Diffusion Model和他们的区别就是latent code和原图是同尺寸大小的。如下图所示，给大家一个直观的认识：Diffusion Model分为前向过程和反向过程，前向过程将输入图片变为纯高斯噪声（就是一个不断加噪的过程），反向过程就是将噪声还原为图片的过程（就是一个不断去噪的过程）

知道Diffusion Model在做什么之后，接下来对Diffusion的前向和反向过程做分析推导

Diffusion的前向过程

1. 前向过程从到的公式

给定真实图片，前向过程中diffusion model对其添加了次高斯噪声，分别得到图（随着的增加，包含越来越多的噪声），这个过程如下表示

下图展示了前向加噪的过程中图片的变化，从左到右为

整个前向加噪过程是马尔科夫过程，即时刻的状态只与时刻有关，在不断加噪的过程中，不断接近纯噪声，，变为正态分布的高斯噪声（为什么下面会讲），在论文中是从0.0001到0.02线性插值的，取，也就是说是不断增加的，是不断减小的

回过头来再看上述分布，随着增加，的均值是的倍，因此最终的均值不断变小，趋近于，而标准正态分布的均值也为0

下面是和随着增加的变化曲线

2. 怎么从直接得到的表达式？

前向过程的最多为1000次，如果每次都单独计算过于耗时，这里推导能够一步到位的方式

为了推导方便，原论文令，，并用重参数化的方法来表示前向过程每一步的数据分布（重参数化方法在文末有介绍），这里我们由得

公式解释部分，上述公式懂的话可以不看
其中公式的红色部分用到了高斯分布的独立可加性，即
由

可得

的最终结果为，其中在次连乘之后接近于，即，即的正态分布，这就是整个前向推导了

3. 关于到的一个疑问

为什么的分布是呢？因为这个公式是作者直接给出的，并没有一个推导，公式表明在加噪的过程中均值要乘上，如果要保证均值最后为0的话，只需要每次乘的值小于1就可以了（虽然方差可能并不是），通过上述推导我们可以发现的最终等于，即，也就是说这个分布能够保证最终收敛为标准高斯分布，但是具体前向分布这个式子怎么得到的，我不是很懂