当前位置: 首页 > news >正文

学网站建设多少钱网站怎么做企业

学网站建设多少钱,网站怎么做企业,根据链接获取网站名称,电商网站首页1.文字到语音的整个过程 文字到语音的一般整体结构 主要是下面这个流程#xff0c;每个网络可能会把其中两者或是三者融合在一起来#xff1b; 长度不同的问题 生成的语音可能和文字的长度并不一样#xff0c;因此需要解决这个问题 Tactron使用的是交叉注意力的方式解…1.文字到语音的整个过程 文字到语音的一般整体结构 主要是下面这个流程每个网络可能会把其中两者或是三者融合在一起来 长度不同的问题 生成的语音可能和文字的长度并不一样因此需要解决这个问题 Tactron使用的是交叉注意力的方式解决他们长度不同的问题fastSpeech直接预测了输出的长度通过将文本信息拷贝几分的方式获得了相同的长度。 2.各种具体的网络结构 2.1WaveNet 2.1.1研究动机 原有的语音生成模型大多采用RNN这个东西太慢了不如采用一个卷积的结构来进行替代;卷积是前后都感知的这不合适因此改一下只让其卷进去前面的部分这样就合理了。称为“因果卷积”既然使用了卷积那么使用空洞卷积就自然而然了。 2.1.2结构和类型 输入输出 将声学模型和发声器全部都融合在一起了 输入处理过的字符串信息输出语音 类型是自回归 2.1.3不能解决的问题 虽然训练的时候比较快但是在预测的时候开始启动时候因为空洞卷积的问题需要多轮。这里不确定需要再确认 2.2tactron 2.2.1研究动机 1.前人的融合工作还是不太够不能真正的端到端因此作者这里再融合一下 2.文本序列较长的时候会导致较大的累计误差作者使用交叉注意力机制来解决这个问题这个貌似也是交叉注意力本身的研究动机 3.预测较慢由于语音信息前后比较相近因此作者就直接一次预测三帧。 2.2.2结构和类型 输入输出 将字符串分析和声学模型融合在一起了 输入是字符串输出是梅尔频谱 网络结构 使用机器翻译借鉴过来的模型CBHG 类型是自回归 2.2.3奇怪的点 虽然声学模块用的是自回归的但是这个交叉注意力一进去其实每个节点不都有全局信息了吗 2.3fastSpeech 2.3.1研究动机 采用自回归是有一定问题的因为自回归是非常缓慢的并且由于累计误差会在最终结果当中产生重大错误前人采用自回归的问题是被迫为之主要是不知道每个文字需要说多长时间于是本文作者发明了一个先预测每个字说多长时间再整体预测全流程该怎么说的网络结果。想要实现这个预测说多久其实也不是很复杂因为可以用别人训练好的TTS模型直接来进行得到。 2.3.2 结构和类型 输入输出 也是将文本分析和声学模型融合在一起 输入是文字串输出是梅尔谱 类型是非自回归 2.4fastSpeech2 之前的网络较为复杂消除蒸馏可以更好的简化网络之前通过长度预测可以调整输入的长度对齐那么是否可以通过类似位置加入其他模块来增加更多语音信息音高、能量、情感等
http://www.w-s-a.com/news/617169/

相关文章:

  • 网站推广策划报告目前做win7系统最好的网站
  • 东莞网站建设咨询公江西网站建设平台
  • 什么是网站功能源码下载站
  • 石家庄制作网站的公司双柏县住房和城乡建设局网站
  • 影视vip网站建设教程ppt模板免费下载 素材红色
  • 内蒙古城乡建设部网站首页平台网站建设ppt
  • 集约化网站建设项目官方网站建设
  • 原创先锋 北京网站建设网站开发电脑内存要多少
  • 婚恋网站建设项目创业计划书网站建设 食品
  • 免费建网站代码查询做导员的网站
  • 做网站的软件电子可以看女人不易做网站
  • 学校响应式网站模板下载仙居住房和城乡建设规划局网站
  • 推广网站的方法有拍卖网站建设
  • 网站建设网站排名优化中国网站服务器哪个好
  • asp网站应用程序网站建设需要提供的资料
  • 网站开发与设计.net微信小程序设计制作
  • 怎样做网站排名优化展馆设计费取费标准一览表
  • 网站建设去哪可接单网站建设与设计大作业
  • 休闲咖啡厅网站开发目标韩国小清新网站模板
  • 做微景观的网站制作网页模板适应不同分辨率
  • 最简单的网站系统昨天军事新闻最新消息
  • 做ps网页设计的网站有哪些wordpress内容付费
  • 有没有免费注册域名的网站科技小制作 手工 简单
  • 网站支付端口win10优化大师怎么样
  • 怎么做云购网站吗网站流量监测
  • 网站被恶意刷流量可以翻外墙的浏览器
  • 网站做直链下载存储解决方案怎么把网站设置为主页面
  • 西安做网站招聘深圳网站见
  • 网站怎么做优化百度能搜索到wordpress 子分类
  • 六安网站建设培训制作网站需要多少时间