<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>遥感生成 on 叶子&amp;都安的博客</title><link>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/</link><description>Recent content in 遥感生成 on 叶子&amp;都安的博客</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Thu, 11 Jun 2026 08:00:00 +0800</lastBuildDate><atom:link href="https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/index.xml" rel="self" type="application/rss+xml"/><item><title>ICLR 21 | Denoising Diffusion Implicit Models</title><link>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/denoising-diffusion-implicit-models/</link><pubDate>Thu, 11 Jun 2026 08:00:00 +0800</pubDate><guid>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/denoising-diffusion-implicit-models/</guid><description>&lt;h1 id="iclr-21--denoising-diffusion-implicit-models">ICLR 21 | Denoising Diffusion Implicit Models&lt;/h1>
&lt;blockquote>
&lt;p>论文链接：https://openreview.net/forum?id=St1giarCHLP&lt;br>
代码链接：https://github.com/ermongroup/ddim&lt;br>
作者单位：斯坦福大学&lt;/p>&lt;/blockquote>
&lt;h2 id="背景">背景&lt;/h2>
&lt;p>DDPM 中，将参数 $T$ 设为一个大值能使生成过程更接近高斯分布，实现更好的性能，但会导致生成速度过慢&lt;/p>
&lt;p>而 DDPM 的最终损失：$L(\theta):=\mathbb{E}_{t,x_0,\epsilon}[||\epsilon-\epsilon_\theta(\sqrt{\bar{\alpha}_t}x_0+\sqrt{1-\bar{\alpha}_t}\epsilon,t)||^2]$ 仅需按照一步加噪公式，从 $q(x_t \mid x_0)$ 中采样一个 $x_t$，与联合分布 $q(x_{1:T} \mid x_0)$ 无关，&lt;/p>
&lt;h2 id="非马尔可夫过程的变分推断">非马尔可夫过程的变分推断&lt;/h2>
&lt;p>将前向过程按反向方向重写（联合分布可使用任意顺序拆解）构造一组前向分布：&lt;br>
&lt;/p>
$$
\begin{aligned}
q_\sigma(x_{1:T} \mid x_0) &amp;:= q_\sigma(x_T \mid x_0)\prod_{t=2}^Tq_\sigma(x_{t-1} \mid x_t,x_0)\\
q_\sigma(x_T \mid x_0) &amp;= \mathcal{N}(\sqrt{\alpha_T}x_0,(1-\alpha_T)I)\\
q_\sigma(x_{t-1} \mid x_t,x_0) &amp;= \mathcal{N}(\sqrt{\alpha_{t-1}}x_0+\sqrt{1-\alpha_{t-1}-\sigma_t^2} \cdot \frac{x_t-\sqrt{\alpha_t}x_0}{\sqrt{1-\alpha_t}},\sigma_t^2I)
\end{aligned}
$$&lt;p>&lt;br>
其中，$\sigma\in\mathbb{R}_{\ge 0}^T$ 为分布的索引，当 $\sigma \rightarrow 0$ 时，若给定 $x_0,x_t$ 则 $x_{t-1}$ 固定&lt;/p></description></item><item><title>NeurIPS 20 | Denoising Diffusion Probabilistic Models</title><link>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/denoising-diffusion-probabilistic-models/</link><pubDate>Mon, 01 Jun 2026 08:00:00 +0800</pubDate><guid>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/denoising-diffusion-probabilistic-models/</guid><description>&lt;h1 id="neurips-20--denoising-diffusion-probabilistic-models">NeurIPS 20 | Denoising Diffusion Probabilistic Models&lt;/h1>
&lt;blockquote>
&lt;p>论文链接：https://proceedings.neurips.cc/paper/2020/hash/4c5bcfec8584af0d967f1ab10179ca4b-Abstract.html&lt;br>
代码链接：https://github.com/hojonathanho/diffusion&lt;br>
作者单位：加州大学伯克利分校&lt;/p>&lt;/blockquote>
&lt;h2 id="背景知识">背景知识&lt;/h2>
&lt;blockquote>
&lt;p>期望公式：&lt;/p>
&lt;ul>
&lt;li>连续变量：$E[X] = \int xp(x)\mathrm{d}x$&lt;/li>
&lt;li>函数：$E[g(X)] = \int g(x)p(x)\mathrm{d}x$&lt;/li>
&lt;/ul>
&lt;p>高斯分布重参数化公式：$x \sim \mathcal{N}(\mu,\sigma^2) \Rightarrow x=\mu+\sigma\epsilon, \epsilon \sim \mathcal{N}(0,1)$&lt;/p>&lt;/blockquote>
&lt;p>前向过程：&lt;br>
&lt;/p>
$$
\begin{aligned}
x_0 &amp;\sim q(x_0)\\
q(x_{1:T} \mid x_0) &amp;:= \prod_{t=1}^T q(x_t \mid x_{t-1})\\
q(x_t \mid x_{t-1}) &amp;:= \mathcal{N}(x_t; \sqrt{1-\beta_t} x_{t-1}, \beta_t I)\\
\end{aligned}
$$&lt;p>&lt;br>
令 $\alpha_t := 1-\beta_t$，$\bar{\alpha}_t := \prod_{s=1}^t \alpha_s$，有一步加噪公式：&lt;br>
&lt;/p>
$$
q(x_t \mid x_0) := \mathcal{N}(x_t; \sqrt{\bar{\alpha}_t}x_0, (1-\bar{\alpha}_t)I)
$$&lt;p>&lt;br>
经重参数化后，采样公式为：&lt;br>
&lt;/p></description></item><item><title>ICML 15 | Deep Unsupervised Learning using Nonequilibrium Thermodynamics</title><link>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/deep-unsupervised-learning-using-nonequilibrium-thermodynamics/</link><pubDate>Sat, 30 May 2026 08:00:00 +0800</pubDate><guid>https://ylfbx329.github.io/posts/%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB/%E9%81%A5%E6%84%9F%E7%94%9F%E6%88%90/deep-unsupervised-learning-using-nonequilibrium-thermodynamics/</guid><description>&lt;h1 id="icml-15--deep-unsupervised-learning-using-nonequilibrium-thermodynamics">ICML 15 | Deep Unsupervised Learning using Nonequilibrium Thermodynamics&lt;/h1>
&lt;blockquote>
&lt;p>论文链接：http://proceedings.mlr.press/v37/sohl-dickstein15.html&lt;br>
代码链接：https://github.com/Sohl-Dickstein/Diffusion-Probabilistic-Models&lt;br>
作者单位：斯坦福大学&lt;/p>&lt;/blockquote>
&lt;h2 id="动机">动机&lt;/h2>
&lt;p>概率模型（probabilistic models）一直在易处理与灵活性之间平衡&lt;/p>
&lt;p>我们定义一个逐渐将一种分布转换为另一分布的马尔科夫链，生成式马尔科夫链即使用 diffusion 过程将一个简单的已知分布转换为目标数据分布&lt;/p>
&lt;p>在此框架下模型用于估计单一 diffusion 过程中的微小扰动，从而降低处理难度；此外，任一平滑的目标分布均存在 diffusion 过程，因此此方法灵活度较高&lt;/p>
&lt;h2 id="方法">方法&lt;/h2>
&lt;p>前向过程（diffusio 过程）：将目标数据分布转换为简单已知分布&lt;br>
逆向过程：在有限的时间步下，从简单分布中生成目标数据分布&lt;/p>
&lt;h3 id="前向过程">前向过程 $q(x^{(0 \cdots T)})$&lt;/h3>
&lt;p>目标数据分布 $q(x^{(0)})$，简单已知分布 $\pi(y)$，马尔可夫 diffusion 核 $T_\pi(y \mid y';\beta)$，$\beta$ 为扩散速率，前向过程可以表示为：&lt;br>
&lt;/p>
$$
\begin{aligned}
\pi(y) &amp;= \int \mathrm{d}y' T_\pi(y \mid y';\beta) \pi(y') \\
q(x^{(t)} \mid x^{(t-1)}) &amp;= T_\pi(x^{(t)} \mid x^{(t-1)};\beta_t) \\
q(x^{(0 \cdots T)}) &amp;= q(x^{(0)}) \prod_{t=1}^{T} q(x^{(t)} \mid x^{(t-1)})
\end{aligned}
$$&lt;h3 id="后向过程">后向过程 $p(x^{(0 \cdots T)})$&lt;/h3>
&lt;blockquote>
&lt;ul>
&lt;li>条件概率公式：$p(x \mid y) = \frac{p(x,y)}{p(y)}$&lt;br>
链式展开：$p(x_1, \cdots ,x_n) = p(x_1)\prod_{i=2}^{n}p(x_i \mid x_1, \cdots ,x_{i-1})$&lt;/li>
&lt;li>边缘概率公式：$p(x) = \int p(x,y) \mathrm{d}y$&lt;/li>
&lt;li>贝叶斯公式：$p(x \mid y) = \frac{p(y \mid x) p(x)}{p(y)}$&lt;/li>
&lt;/ul>&lt;/blockquote>
&lt;p>对于高斯扩散，在时间步数 $T$ 足够大、每一步扩散速率 $\beta$ 足够小时，前向扩散过程接近连续扩散过程。此时其反向转移可以近似采用与前向转移相同的分布族进行建模。因此，若前向扩散变换 $q(x^{(t)} \mid x^{(t-1)})$ 是高斯形式，则反向生成变换 $p(x^{(t-1)} \mid x^{(t)})$ 也可被视为高斯分布。后向过程可表示为：&lt;br>
&lt;/p></description></item></channel></rss>