广州开发网站哪家专业,重庆承越网站制作公司,网站开发创意想法,网站ftp怎么登陆transformer序列长度大导致计算复杂度高 GAN 2. 训练过程
第一阶段#xff1a;固定「判别器D」#xff0c;训练「生成器G」。使用一个性能不错的判别器#xff0c;G不断生成“假数据”#xff0c;然后给这个D去判断。开始时候#xff0c;G还很弱#xff0c;所以很容易被…transformer序列长度大导致计算复杂度高 GAN 2. 训练过程
第一阶段固定「判别器D」训练「生成器G」。使用一个性能不错的判别器G不断生成“假数据”然后给这个D去判断。开始时候G还很弱所以很容易被判别出来。但随着训练不断进行G技能不断提升最终骗过了D。这个时候D基本属于“瞎猜”的状态判断是否为假数据的概率为50%。
第二阶段固定「生成器G」训练「判别器D」。当通过了第一阶段继续训练G就没有意义了。这时候我们固定G然后开始训练D。通过不断训练D提高了自己的鉴别能力最终他可以准确判断出假数据。
重复第一阶段、第二阶段。通过不断的循环「生成器G」和「判别器D」的能力都越来越强。最终我们得到了一个效果非常好的「生成器G」就可以用它来生成数据。 CGAN
CGAN的核心思想在于将额外的条件信息引入到原始GAN的架构中使得生成器和判别器在训练过程中同时考虑条件变量。