当前位置: 首页 > news >正文

天水网站建设公司黄冈网站设计推广哪家好

天水网站建设公司,黄冈网站设计推广哪家好,网站建设手机网站,幼儿网站模板1. 什么是RNN 循环神经网络#xff08;Recurrent Neural Network, RNN#xff09;是一类以序列#xff08;sequence#xff09;数据为输入#xff0c;在序列的演进方向进行递归#xff08;recursion#xff09;且所有节点#xff08;循环单元#xff09;按链式连接的递…1. 什么是RNN 循环神经网络Recurrent Neural Network, RNN是一类以序列sequence数据为输入在序列的演进方向进行递归recursion且所有节点循环单元按链式连接的递归神经网络recursive neural network。 2.RNN的优势 2-1 RNN  在传统的全连接神经网络中模型结构是从输入层到隐含层再到输出层层与层之间是全连接的每层之间的节点是无连接的。前提假设都是元素之间是相互独立的输入与输出也是独立的。这样就造成了在训练时全连接神经网络学习不到上下文之间的联系。例如要预测句子的下一个单词是什么一般需要用到前面的单词因为一个句子中前后单词并不是独立的。如下图为全链接神经网络。 RNN之所以称为循环神经网路即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中即隐藏层之间的节点不再无连接而是有连接的并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。如下图为循环神经网络。 循环神经网络的本质是像人一样拥有记忆的能力。因为我们当前时刻的输出是由记忆和当前时刻的输入决定的就像你现在大四你的知识是由大四学到的知识当前输入和大三以及大三以前学到的东西的记忆的结合RNN在这点上也类似神经网络最擅长做的就是通过一系列参数把很多内容整合到一起然后学习这个参数因此他的输出就依赖于当前的输入和记忆。简要的介绍RNN就是一个简要的结构在重复使用。RNN的基础定义如下 其中Xt:表示t时刻的输入ot:表示t时刻的输出ht:表示t时刻的记忆。 其中使用f()作为激活函数一般使用tanh,做非线性映射过滤信息。在预测的时候带着当前时刻的记忆ht去预测。假如要预测“我是中国“的下一个词出现的概率这里已经很显然了运用softmax来预测每个词出现的概率但预测不能直接带用一个矩阵来预测所有预测的时候还要带一个权重矩阵W,用公式表示为: U、V、W作为参数是被所有的cell是共享的。 2-2 RNN的向前传播流程 RNN 一个非常重要的概念就是时刻。首先它进行前向传递并进行预测。其次它使用损失函数将预测与基础事实进行比较。损失函数输出一个错误值该错误值是对网络执行得有多糟糕的估计。最后它使用该误差值进行反向传播计算网络中每个节点的梯度。 时刻的循环神经网络的输入包括t和从t_0时刻传递来的隐藏状态h_0。 循环神经网络在时刻接收到输入之后隐藏层的值是 输出值是 。 的值不仅仅取决于 还取决于。为了将当前时刻的隐含状态 转化为最终的输出 循环神经网络还需要另一个全连接层来完成这个过程。这和卷积神经网络中最后的全连接层意义是一样的。如果不考虑 RNN 的输出还需要一个全连接层的情况那么 和  的值是一样的。 3.RNN梯度消失 3-1 梯度消失的定义 网络层之间的梯度值小于 1.0重复相乘导致的指数级减小会产生梯度消失主要是因为网络层数太多太深导致梯度无法传播如果导数小于1那么随着网络层数的增加梯度更新信息会朝着指数衰减的方式减少从而导致层数比较浅的权重没有更新这就是梯度消失。 3-2 梯度消失本质原因 梯度传递的链式法则所导致的神经网络的反向传播是逐层对激活函数求偏导数并相乘。梯度消失、爆炸其根本原因在于反向传播训练法则属于先天不足。 3-3 链式法则 假的时间序列只有三段 [公式] 为给定值神经元没有激活函数则RNN最简单的前向传播过程如下 损失函数为  对t3时刻的 U、V、W求损失函数 L3的偏导 化简之后的公式如下 tanh激活函数可以将实数映射到-1,1区间当tanh的输出极值接近-1和1时也面临梯度饱和的问题。 tanh和tanh导数的图像如下 可以看出 tanh‘   1 训练过程中几乎都是小于1的而W 的值一般会处于0~1之间当时间序列足够长即t足够大时足够多1的值累乘就会造成趋近于0这就造成了梯度消失而当W值很大(一般为初始化不当引起)时就会趋近于无穷这就造成了梯度爆炸。 特别说明  Q为什么梯度消失使RNN的长时记忆失效会忘记很久之前的信息 A:        因为RNN的特殊性在于它的权重是共享的。参数在任何时刻的梯度不会出现问题因为不依赖于前面的时刻但是参数和每一时刻都由前面所有时刻共同决定是一个相加的过程。这样会存在一个问题如果文本很长计算了若干步之后计算最前面的导数时最前面的导数就会消失或爆炸但当前时刻整体的梯度并不会消失因为它是求和的过程当下的梯度总会在只是前面的梯度没了但是更新时由于权值共享所以整体的梯度还是会更新通常人们所说的梯度消失就是指的这个指的是当下梯度更新时用不到前面的信息了因为距离长了前面的梯度就会消失也就是没有前面的信息了但要知道整体的梯度并不会消失因为当下的梯度还在并没有消失。这样整体的梯度还是会更新只是将前面的信息给遗忘了。
http://www.w-s-a.com/news/491449/

相关文章:

  • 视频网站用什么做的好深圳的小程序开发公司
  • 南京网站定制开发商城网站免费模板
  • 青海学会网站建设公司照片组合拼图
  • 中国建设银行福清分行网站爱站网权重查询
  • 外贸通网站建设网站建设7个主要流程图
  • 元气森林网络营销方式医疗网站优化怎么做
  • 手机网站制作报价表做网站公司做网站公司
  • 湖州网站设计吉林网站建设哪家好
  • 做存储各种环境信息的网站使用tag的网站
  • 阿里云用ip做网站网站开发员属于
  • 外链网盘下载南宁seo推广优化
  • 网站的推广方案有哪些此网站可能有
  • wordpress更改链接后网站打不开一键生成个人网站
  • 网站建设后台有哪些东西前端开发培训一般多少钱
  • 高端建设网站公司网站开发 源码
  • 企业网站的劣势园林景观设计公司简介范文
  • 网站建设程序招聘东营建设信息网登录
  • o2o是什么意思通俗讲seo与网站优化 pdf
  • 外贸网站外包一般建设一个网站多少钱
  • 抄袭别人网站的前端代码合法吗网络促销策略
  • 用wordpress制作网站做资源网站
  • wordpress 发布网站南宁网站建设网站
  • 职业生涯规划大赛心得贵阳哪家网站做优化排名最好
  • wordpress 图片懒加载北京网站优化和推广
  • 深圳网站建设工作一个dede管理两个网站
  • 被禁止访问网站怎么办中国建筑网官网查询系统
  • 网站管理运营建设网贷网站
  • 深圳市龙岗区住房和建设局网站怎么给网站做404界面
  • 设计类网站网站系统 建设和软件岗位职责
  • 网站后台打开慢站长之家网址ip查询