Conditional_GAN_jittor

Generative Adversarial Nets（GAN）提出了一种新的方法来训练生成模型：输入为一个随机向量 z, 生成器 G 输出一幅图像 G(z), 而判别器 D 需要将真实图像 x 与合成图像 G(z) 区分开来。然而，GAN 对于要生成的图片缺少控制。Conditional GAN（CGAN）通过添加显式的条件或标签，来控制生成的图像。在生成器 generator 和判别器 discriminator 中添加相同的额外信息 y，GAN 就可以扩展为一个 conditional 模型。y 可以是任何形式的辅助信息，例如类别标签或者其他形式的数据。我们可以通过将 y 作为额外输入层，添加到生成器和判别器来完成条件控制。

图 1: CGAN 模型示意

GAN 模型 的损失函数设计为：

$\mathop{\min}\limits_{G} \mathop{\max} \limits_ {D} V (D, G) = E_{x∼pdata(x)} [log D(x)] + E_{z∼pz(z)} [log(1 − D(G(z)))] \,\,\,\,\,\;\;\qquad(1)$

对于判别器 D，我们要训练最大化这个 loss。如果 D 的输入是来自真实样本的数据 x, 则 D 的输出 D(x) 要尽可能地大，log(D(x)) 也会尽可能大。如果 D 的输入是来自 G 生成的假图片 G(z)，则 D 的输出 D(G(z)) 应尽可能地小，从而 log(1-D(G(z)) 会尽可能地大。这样可以达到 max D 的目的。

对于生成器 G，我们要训练最小化这个 loss。对于 G 生成的假图片 G(z)，我们希望尽可能地骗过 D，让它觉得我们生成的图片就是真的图片，这样就达到了 G“以假乱真”的目的。那么 D 的输出 D(G(z)) 应尽可能地大，从而 log(1-D(G(z)) 会尽可能地小。这样可以达到 min G 的目的。D 和 G 以这样的方式联合训练，最终达到 G 的生成能力越来越强，D 的判别能力越来越强的目的。

在 CGAN 中，我们增加了限定条件 y，即数字 0-9 的类别标签, 因此生成器和判别器的输入都需要增加类别标签的维度，若真实图片为 x，对应标签为 y1，随机向量为 z，随机标签为 y2，则生成器的输出为 G(z, y2)，判别器的输出为 D(G(z, y2), y2) 及 D(x, y1)。本项目采用平方误差函数替代对数函数来计算损失。记合成图片为第 0 类，真实图片为第 1 类，则分类器的损失函数为：

$L_{D} = \frac{1}{2}(D(G(z,y_{2}),y_{2})^{2}+(1-D(x,y_{1}))^{2}) \qquad \qquad(2)$