Dataset 2D shapesAdamGeneratorFC 256, 256, Deconv 128x4x4, 64x4x4 (stride 2). Tanh. 数据集 2D 形状 Adam 生成器 FC 256, 256, 反卷积 128x4x4, 64x4x4 (步长 2)。Tanh 激活函数。 | Optimiser 优化器 | Architecture 架构 | |
2D shapes (VAE) 2D 形状 (变分自编码器) | Adagrad 1e-2 自适应梯度算法 1e-2 | Input Encoder Latents Decoder 输入编码器潜在空间解码器 | 4096 (flattened 64x64x1). FC 1200, 1200. ReLU activation. 10 FC 1200, 1200, 1200, 4096. Tanh activation. Bernoulli. 4096(64x64x1 展平)。全连接层 1200、1200。ReLU 激活函数。10 个全连接层 1200、1200、1200、4096。Tanh 激活函数。伯努利分布。 |
2D shapes 二维形状 | rmsprop (as in Kulkarni et al. 2015 均方根传播优化器(同 Kulkarni 等人 2015 年论文) | Input 输入 | 64x64x1. Conv 96x3x3, 48x3x3, 48x3x3 (padding 1). ReLU activation and Max pooling 2x2. 10 Unpooling, Conv 48x3x3, 96x3x3, 1x3x3. ReLU activation, Sigmoid. 64x64x1 输入。卷积层 96x3x3、48x3x3、48x3x3(填充 1)。ReLU 激活函数和 2x2 最大池化。10 次反池化,卷积层 48x3x3、96x3x3、1x3x3。ReLU 激活函数,Sigmoid 输出。 |
(DC-IGN) (DC-IGN) | Encoder Latents 编码器潜在空间 | ||
Decoder 解码器 | |||
(InfoGAN) (信息 GAN) | 1e-3 (gen) 2e-4 (dis) 1e-3(生成器) 2e-4(判别器) | Discriminator 判别器 | Conv and FC reverse of generator. Leaky ReLU activation. FC 1. Sigmoid activation. 卷积与全连接层结构为生成器的反向。使用 Leaky ReLU 激活函数。全连接层输出 1 维,Sigmoid 激活。 |
Recognition Latents 识别潜在变量 | Conv and FC shared with discriminator. FC 128, 5. Gaussian 10: 与判别器共享卷积及全连接层。全连接层输出 128 维和 5 维。高斯分布 10: | ||
Chairs (VAE) 椅子(变分自编码器) | Adam 1e-4 亚当优化器 学习率 1e-4 | Input Encoder Latents Decoder 输入 编码器 潜在空间 解码器 | 64x64x1. Conv 32x4x4 (stride 2), 32x4x4 (stride 2), 64x4x4 (stride 2), 64x4x4 (stride 2), FC 256. ReLU activation. 32 Deconv reverse of encoder. ReLU activation. Bernoulli. 64x64x1。卷积层 32x4x4(步长 2),32x4x4(步长 2),64x4x4(步长 2),64x4x4(步长 2),全连接层 256。ReLU 激活函数。32 个反卷积层与编码器结构对称。ReLU 激活函数。伯努利分布。 |
CelebA 名人面部数据集(CelebA) | Adam 亚当 | Input 输入 | 64x64x3. 64x64x3 |
(VAE) (变分自编码器) | 1e-4 0.0001 | Encoder 编码器 | Conv 32x4x4 (stride 2), 32x4x4 (stride 2), 64x4x4 (stride 2), 64x4x4 (stride 2), FC 256. ReLU activation. 卷积层 32x4x4 (步长 2), 32x4x4 (步长 2), 64x4x4 (步长 2), 64x4x4 (步长 2), 全连接层 256。ReLU 激活函数。 |
Latents 潜在变量 | 32 | ||
Decoder 解码器 | Deconv reverse of encoder. ReLU activation. Gaussian. 反卷积层与编码器对称结构。ReLU 激活函数。高斯分布。 | ||
3DFaces 3D 人脸 | Adam 1e-4 Adam 优化器 1e-4 | Input 输入 | 64x64x1. 64x64x1。 |
(VAE) (变分自编码器) | Encoder 编码器 | Conv 32x4x4 (stride 2), 32x4x4 (stride 2), 64x4x4 (stride 2), 64x4x4 (stride 2), FC 256. ReLU activation. 卷积层 32x4x4 (步长 2), 32x4x4 (步长 2), 64x4x4 (步长 2), 64x4x4 (步长 2), 全连接层 256。ReLU 激活函数。 | |
Latents 潜在变量 | 32 | ||
Decoder 解码器 | Deconv reverse of encoder. ReLU activation. Bernoulli. 解码器为编码器的逆过程,采用 ReLU 激活函数,伯努利分布。 |
Model | Classification accuracy 分类准确率 | |||||
id 标识 | scale 比例 | rotation 旋转 | position | position Y 位置 Y | average 平均 | |
PCA | 43.38 | 36.08 | 5.96 | 60.66 | 60.15 | 41.25 |
ICA | 59.6 | 34.4 | 7.61 | 25.96 | 25.12 | 30.54 |
DC-IGN | 44.82 | 45.92 | 15.89 | 47.64 | 45.88 | 40.03 |
InfoGAN 信息生成对抗网络 | 44.47 | 40.91 | 6.39 | 27.51 | 23.73 | 28.60 |
VAE untrained 未训练的变分自编码器 | 39.44 | 25.33 | 6.09 | 16.69 | 14.39 | 20.39 |
VAE | 41.55 | 24.07 | 8 | 16.5 | 18.72 | 21.77 |
β-VAE β-变分自编码器 | 50.08 | 43.03 | 20.36 | 52.25 | 49.5 | 43.04 |
z_- azimuth z_ - 方位角 | |||||||||||||
✓ | ✓ | 1 | 4 | 4 | 4 | 4 | ✓ | ✓ | 1 | 4 | 1 | 1 | 1 |
- | 业 | ↘ | ↘ | ↘ | ↘ | ↘ | ✓ | ✓ | ✓ | - | 江 | ↘ | 了 |
. | 2 | A | 具 | A | A | A | 土 | 土 | 君 | A | A | 的 | 的 |
✓ | 1 | 1 | 4 | A | A | A | 土 | 4 | 4 | A | 1 | 1 | 1 |
. | - | A | 王 | A | A | A | 在 | 在 | 五 | A | , | 的 | 下 |
- | , | ↘ | - | - | - | - | ✓ | - | - | ↘ | ↘ | ↘ | 了 |
+ | - | 5 | B | 3 | 2 | 7 | ✓ | 4 | 4 | 业 | F | 小 | 下 |
↘ | - | ↘ | ↘ | ↘ | ↘ | ↘ | ✓ | ✓ | ✓ | 工 | ↘ | ↘ | 了 |
+ | + | ↘ | ↘ | ↘ | ↘ | ✘ | ✓ | ✓ | ✓ | 证 | ↘ | ↘ | ↘ |
. | 业 | 业 | 五 | h | 工 | ✘ | ✓ | ✓ | 正 | 业 | 百 | 业 | 卜 |
山 | ↘ | h | h | h | h | ↘ | ✓ | ✓ | 工 | 五 | h | h | 上 |
✓ | ✓ | ✓ | ✘ | 4 | 土 | 土 | ✓ | ✓ | ✓ | . | ↘ | ↘ | ✘ |
✓ | ↘ | - | ↘ | In 在 | + | + | ✓ | ✓ | 【 | - | 理 | ↘ | 下 |
。 | ↘ | ↘ | ↘ | ↘ | ↘ | ↘ | ✓ | ✓ | ✓ | ✘ | ↘ | ↘ | 下 |
+ | 4 | ✓ | ✓ | ✓ | 4 | 4 | ✓ | ✓ | ✓ | 四 | ↘ | ↘ | ↘ |
↘ | ↘ | ↘ | ↘ | ↘ | ↘ | ↘ | ✓ | ✓ | ✓ | - | ↘ | ↘ | ↘ |
. | 0 | 量 | 4 | 4 | 4 | A | 1 | 4 | 4 | 4 | A | 表 | 1 |
✓ | - | 4 | 通 | 业 | + | + | ✓ | ✓ | 青 | 四 | 石 | 小 | 下 |
- | 甲 | - | - | ↘ | ↘ | ✘ | ✓ | ✓ | ✓ | - | - | 小 | 下 |
+ | 舟 | A | A | A | B | 8 | ✓ | ✓ | ✓ | 用 | A | + | , |
+ | . | - | . | 3 | , | F | ✓ | ✓ | ✓ | - | - | ↘ | ↘ |
✓ | - | ✓ | 4 | + | + | + | 土 | 土 | + | A | 开 | In 在 | In 在 |
1 | ||||||||||||||
在 | + | 在 | 4 | 1 | 1 | 1 | ; | ✓ | 4 | 1 | ✓ | ✓ | ✓ | ✓ |
工 | 工 | ↘ | 江 | ↘ | ↘ | ↘ | ' | F | k | h | 工 | ↘ | ↘ | ↘ |
A | A | A | A | A | A | ↘ | ! | 网 | A | A | B | ↘ | ↘ | ↘ |
A | A | A | A | A | 1 | 1 | ! | A | A | A | A | 2 | 三 | ■ |
五 | 王 | 王 | 王 | 2 | 夏 | 2 | ! | A | A | 王 | 王 | 王 | 三 | - |
↘ | ↘ | ↘ | ↘ | ↘ | ↘ | ↘ | ! | 3 | A | 业 | 理 | , | ↘ | ↘ |
的 | 业 | 属 | - | 1 | x | x | : | A | 1 | A | - | 理 | ↘ | ↘ |
2 | 了 | ↘ | ↘ | ↘ | ↘ | ✘ | 易 | 的 | 的 | 小 | 了 | ↘ | ↘ | |
h | h | ↘ | ↘ | ↘ | ✘ | + | 商 | 6 | k | ↘ | ↘ | ↘ | - | |
h | h | 工 | 业 | 业 | 复 | 8 | A | h | 业 | 业 | ↘ | ↘ | ↘ | |
h | h | h | h | k | k | 业 | I | h | h | h | h | ↘ | ↘ | ↘ |
土 | 土 | ✓ | ✓ | ✘ | ✓ | ✓ | ✓ | 4 | 4 | 4 | ✓ | ✓ | ✓ | |
了 | 了 | ↘ | ↘ | ↘ | ↘ | + | ' | 弄 | 的 | 的 | 小 | ↘ | ↘ | ↘ |
+ | ↘ | ↘ | ↘ | ↘ | + | + | ! | 有 | F | ↘ | ↘ | ↘ | ↘ | ↘ |
在 | 土 | ✓ | ✓ | ✓ | ✓ | ✓ | ! | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
↘ | ↘ | ↘ | ↘ | > | ✘ | ✘ | ! | 1 | 1. | 小 | ↘ | ↘ | ↘ | ↘ |
A | 有 | a | 业 | 业 | 4 | 4 | ! | 4 | 业 | 免 | 2 | 2 | 2 | 2 |
兰 | 通 | 工 | ✓ | a | 1 | ✓ | ! | 4 | 业 | 4 | 通 | 通 | - | - |
h | ↘ | ↘ | ↘ | ↘ | ↘ | \} } | : | A | 胃 | A | 3 | - | - | - |
h | A | A | A | A | A | 2 | I | 商 | A | A | A | ↘ | ↘ | - |
- | - | - | - | - | 2 | 2 | I | 1 | 1 | 果 | - | - | ↘ | ↘ |
+ | + | - | + | - | 4 | 4 | I | 4 | 易 | + | + | + | - | - |