当前位置: 首页 > news >正文

android 网站模板下载崇文网站建设

android 网站模板下载,崇文网站建设,郑州网页设计培训,宣传网站建设DIFFWAVE: A VERSATILE DIFFUSION MODEL FOR AUDIO SYNTHESIS Zhifeng Kong, Computer Science and Engineering, UCSD, ICLR2021, Code, Paper 1. 前言 在这项工作中#xff0c;我们提出了DiffWave#xff0c;这是一种用于条件和无条件波形生成的多功能扩散概率模型。该模…DIFFWAVE: A VERSATILE DIFFUSION MODEL FOR AUDIO SYNTHESIS Zhifeng Kong, Computer Science and Engineering, UCSD, ICLR2021, Code, Paper 1. 前言 在这项工作中我们提出了DiffWave这是一种用于条件和无条件波形生成的多功能扩散概率模型。该模型是非自回归的通过具有合成过程中恒定步数的马尔可夫链将白噪声信号转换为结构化波形。通过在数据似然上优化一种变体的变分下界该模型能够高效训练。DiffWave在不同的波形生成任务中产生高保真音频包括基于梅尔频谱图的神经声码化、类别条件生成和无条件生成。我们证明DiffWave在语音质量方面与强大的WaveNet声码器相匹配MOS4.44对比4.43同时合成速度更快数个数量级。特别是在具有挑战性的无条件生成任务中它在音频质量和从各种自动和人工评估中得到的样本多样性方面明显优于自回归和基于GAN的波形模型。 2. 整体思想 扩散模型的U-Net换为1维的网络其他基本一致 3. 方法 大多数先前的波形模型侧重于具有信息性局部条件的音频合成例如梅尔频谱图或对齐的语言特征只有少数例外用于无条件生成。已经注意到自回归模型在无条件设置下往往会生成虚构的类似词汇的声音或者在无条件情况下生成较差的样本。这是因为需要生成非常长的序列例如一个秒的语音需要生成16,000个时间步而没有任何条件信息。 扩散概率模型简称扩散模型是一类有前途的生成模型它使用马尔可夫链逐渐将一个简单分布例如各向同性高斯分布转化为复杂的数据分布。尽管数据似然性难以计算但扩散模型可以通过优化变分下界来高效地进行训练。最近在图像合成中已经展示了一种特定的参数化方式取得了成功该方式与去噪分数匹配有关。扩散模型可以利用扩散加噪过程而无需可学习参数从训练数据中获得“白化”的潜在表示。因此与其他模型相比训练过程中不需要额外的神经网络。这避免了由于两个网络的联合训练而产生的“后验崩溃”或“模式崩溃”问题因此对于高保真度的音频合成非常有价值。 在这项工作中我们提出了DiffWave一种用于原始音频合成的多功能扩散概率模型。DiffWave相比先前的工作具有几个优势i) 它是非自回归的因此可以并行合成高维波形。ii) 它是灵活的因为与需要保持潜在表示与数据之间双射关系的流模型不同它不强加任何架构约束。这导致了仍然能够生成高保真语音的小型神经声码器。iii) 它使用基于单一ELBO的训练目标无需任何辅助损失例如基于频谱图的损失进行高保真度的合成。iv) 它是一个多功能模型可为有条件和无条件波形生成产生高质量的音频信号。具体而言我们做出了以下贡献 DiffWave采用了受WaveNet启发的前馈和双向扩张卷积架构。它在语音质量方面与强大的WaveNet声码器相匹配同时合成速度更快因为它仅需要进行少量的顺序步骤即可生成非常长的波形。 我们的小型DiffWave具有2.64M参数并在V100 GPU上以超过5倍于实时的速度合成22.05 kHz的高保真语音而无需经过专门设计的内核。虽然它的速度仍然比最先进的基于流的模型慢但它的占用空间更小。我们期望通过在未来优化其推理机制来进一步提高速度。 在具有挑战性的无条件和类条件波形生成任务中DiffWave在音频质量和多样性方面显著优于WaveGAN和WaveNet这是通过多个自动和人工评估进行衡量的。 网络结构如图。输入一维输出一维算法流程如下其实和DDPM一样的 局部条件器在语音合成中神经声码器可以在对齐的语言特征、从文本到频谱图模型得到的梅尔频谱图或文本到波形架构中的隐藏状态的条件下合成波形。在这项工作中**我们将DiffWave作为一个神经声码器以梅尔频谱图为条件进行测试。我们首先通过转置的2D卷积将梅尔频谱图上采样到与波形相同的长度。在将其梅尔频谱图映射为2C通道的每个层特定的Conv1×1之后条件器作为偏差项添加到每个残差层的扩张卷积中。超参数可以在第5.1节中找到。 全局条件器在许多生成任务中条件信息是由全局离散标签例如说话者ID或单词ID给出的。在所有实验中我们使用维度为128的共享嵌入。在每个残差层中我们应用层特定的Conv1×1将dlabel映射到2C通道并在每个残差层的扩张卷积后将嵌入作为偏差项添加。
http://www.w-s-a.com/news/19341/

相关文章:

  • 网页开发与网站开发企业网站托管服务常用指南
  • 一站式服务图片临沂做进销存网站
  • 鸣蝉智能建站标准物质网站建设模板
  • 电商网站建设技术员的工作职责商业网站制作价格
  • 网站html模板免费下载公司的网站建设费用入什么科目
  • 高中生做网站网页网页制作教程零基础学会
  • 做金融网站有哪些要求WordPress站内搜索代码
  • 济南网站怎么做seowordpress注册发邮件
  • 珠海网站设计平台东莞市手机网站建设平台
  • 网站开发文档合同怎么在wordpress导航条下方加入文字广告链接
  • 网站建设需怎么做有网站怎么做企业邮箱
  • 网站制作流程视频教程小程序多少钱一年
  • 暗网是什么网站花都网站建设哪家好
  • 贵州网站开发流程晋江论坛手机版
  • 网站建设丿金手指谷哥14阿里巴巴官网电脑版
  • 网站开发招聘信息匿名ip访问网站受限
  • 网站转app工具网站规划建设与管理维护大作业
  • flash是怎么做网站的.net购物网站开发
  • 烟台网站建设求职简历品质商城网站建设
  • 做百度外链哪些网站权重高点做网站具备的条件
  • 怎么样用ppt做网站红番茄 网站点评
  • 建设银行河北分行招聘网站哪里能找到网站
  • 兰州营销型网站网站建设收费标准
  • 网站首页动图怎么做自己做网站很难
  • 自建网站如何盈利推广引流最快的方法
  • 网页设计网站结构图怎么弄网站用户 分析
  • 企业手机网站建设策划天津网页设计工作
  • 苏州vr全景网站建设公司怎么讲解网页的制作技术
  • 徐州智能建站怎么做苏州建设网站首页
  • 网站支付功能报价wordpress主页透明