当前位置: 首页 > news >正文

吉林市教做网站wordpress网站响应时间太长

吉林市教做网站,wordpress网站响应时间太长,长春鸿祥建设有限公司网站,软文客一、说明 深度学习往往感觉像是在雪山上找到自己的道路。拥有坚实的原则会让你对做出决定更有信心。我们都去过那里 在上一篇文章中#xff0c;我们彻底介绍并检查了 LSTM 单元的各个方面。有人可能会争辩说#xff0c;RNN方法已经过时了#xff0c;研究它们是没有意义的。的… 一、说明         深度学习往往感觉像是在雪山上找到自己的道路。拥有坚实的原则会让你对做出决定更有信心。我们都去过那里 在上一篇文章中我们彻底介绍并检查了 LSTM 单元的各个方面。有人可能会争辩说RNN方法已经过时了研究它们是没有意义的。的确最近一类称为变形金刚[5]的方法已经完全确定了自然语言处理领域。然而深度学习从未停止让我感到惊讶包括RNN。也许有一天我们会看到一个巨大的卷土重来。 二、RNN VS 变压器 请记住在以下情况下与变形金刚相比RNN 仍然是最好的选择 序列长度太长。该任务需要实时控制机器人否则下一个时间步长无法先验地获得。没有一个巨大的数据集来利用变压器的迁移学习能力。计算机视觉问题是弱监督动作识别。是的。混合CNN-RNN方法以及连接主义时间分类CTC损失[6]仍然非常有效。 了解更多关于RNN的其他原因包括混合模型。例如我最近遇到了一个模型[4]它产生了真实的实值多维医疗数据系列它结合了递归神经网络和GAN。所以你永远不知道它们在哪里会派上用场。 无论如何基本原理是要掌握的。这一次我们将审查并构建门控循环单元GRU作为LSTM的自然紧凑变体。最后我们将根据问题提供有关使用哪个单元格的多个比较见解。 此处提供了随附的笔记本代码。 三、GRU简化 LSTM 单元 我们已经看到了LSTM如何能够预测顺序数据。最初引入 LSTM 时出现的问题是参数数量过多。让我们首先说提出的称为 GRU 的 LSTM 变体的动机是简化参数数量和执行的操作。 在我们进入方程之前让我们澄清一个重要的事实LSTM和GRU细胞的原理在长期序列建模方面是常见的。首先我们可以处理任意数量的时间步长此外我们试图洗去多余的信息并合并存储在权重中的内存组件。存储器由隐藏状态向量引入网络该向量对于每个输入序列都是唯一的每次从\t0\的零元素向量开始。 现在让我们看看略有不同的数学同样我们将逐步分析它们。我在这里只是将它们作为一个参考点。为 其中 N 是每个时间步的特征长度而 其中 H 是隐藏状态维度GRU 方程如下 四、公式1复位门 该门与 LSTM 单元的遗忘门非常相似。生成的重置向量 r 表示将确定将从先前隐藏的时间步中删除哪些内容的信息。与遗忘门一样我们通过逐元素乘法应用遗忘运算由 Hadamard 乘积运算符表示。我们将重置向量计算为当前时间步的输入向量以及先前隐藏状态的线性组合。 这两种运算都是用矩阵乘法 nn.PyTorch 中的线性。请注意对于第一个时间步隐藏状态通常是用零填充的向量。这意味着没有关于过去的信息。最后应用非线性激活即Sigmoid。此外通过使用激活函数sigmoid结果位于01范围内这说明了训练稳定性。 GRU 的输入和输出门在所谓的更新门中的合并就在这里发生。我们计算输入向量 x 和先前隐藏状态的另一种表示但这次使用不同的可训练矩阵和偏差。向量 z 将表示更新向量。 五、等式3几乎输出分量 向量 n 由两部分组成;第一个是应用于输入的线性层类似于 LSTM 中的输入门。第二部分由复位向量 r 组成应用于先前的隐藏状态。请注意此处的遗忘/重置向量直接应用于隐藏状态而不是将其应用于 LSTM 单元的细胞向量 c 的中间表示。 首先在所描述的方程中请注意 1 基本上是 0 的向量。由于 z 的值位于 11 范围内因此 1-z 也属于同一范围。但是向量 z 的元素具有互补值。很明显元素级操作应用于 z 和 -z。 有时我们通过分析极端情况来理解事物。在极端情况下假设 z 是 1 的向量。那是什么意思 简单地说这意味着输入将被忽略因此下一个隐藏状态将是前一个状态在相反的情况下z 将是零元素向量这意味着之前的隐藏状态几乎被忽略。重要的是我使用这个词几乎是因为更新向量 n 在应用重置向量后受到先前隐藏状态的影响。尽管如此复发几乎就消失了 直观地共享向量 z 平衡了先前隐藏状态和更新输入向量 n 的影响。 现在我为什么选择使用共享的世界作为z变得深刻。以上所有内容都可以在维基百科的下图中说明 图片来源Jeblad — 自己的作品CC BY-SA 4.0 我不是这些图表的忠实粉丝的原因是因为它们可以用标量输入x和h来解释这至少是误导性的。 第二不清楚可训练矩阵在哪里。基本上当你在RNN旅程中考虑这些图表时试着认为x和h每次使用时都会乘以权重矩阵。 就个人而言我更喜欢深入研究方程式。幸运的是数学从不说谎 简而言之复位门r 矢量确定如何将新输入与以前的存储器融合而更新门定义剩余多少先前存储器。 这就是您需要知道的全部内容以便深入了解GRU细胞的工作原理。它们的连接方式在空间和时间上与 LSTM 完全相同 隐藏的输出向量将是下一个 GRU 单元/层的输入向量。 可以通过同时以反向方式处理序列并连接隐藏向量来定义双向。 六、LSTM 与 GRU 细胞使用哪一个 GRU单元于2014年引入而LSTM单元于1997年引入因此GRU的权衡尚未得到如此彻底的探索。在许多任务中这两种架构都能产生相当的性能 [1]。通常情况下超参数的调整可能比选择合适的单元格更重要。但是最好将它们并排比较。 以下是基本的 5 个讨论点 值得一提的是这两种架构都是为了解决梯度消失问题而提出的。这两种方法都利用不同的方式将以前的时间步长信息与门融合以防止梯度消失。然而LSTM 中的梯度流来自三条不同的路径门因此直观地与 GRU 相比您会观察到梯度下降的可变性更大。如果您想要更快、更紧凑的模型GRU 可能是您的选择因为它们的参数更少。因此在许多应用程序中它们可以更快地训练。在序列不太大的小规模数据集中通常选择GRU细胞因为数据较少LSTM的表达能力可能不会暴露出来。从这个角度来看GRU被认为在更简单的结构方面更有效。另一方面如果您必须处理大型数据集LSTM 的更大表达能力可能会带来更好的结果。理论上LSTM细胞应该记住比GRU更长的序列并在需要建模长程相关性的任务中优于它们。根据方程可以观察到GRU单元比LSTM少一个门。准确地说只是一个复位和更新门而不是 LSTM 的忘记、输入和输出门。基本上GRU 单元控制信息流而不必使用单元存储单元在 LSTM 方程中表示为 c。它公开整个内存与 LSTM 不同没有任何控制。因此如果这是有益的则基于手头的任务。 总而言之答案在于数据。没有明确的赢家可以说哪一个更好。确定哪一个最适合您的问题的唯一方法是训练两者并分析它们的性能。为此以灵活的方式构建深度学习项目非常重要。 七、结论 在本文中我们提供了对 GRU 单元的回顾。我们观察到它的独特特征我们甚至建立了自己的细胞用于预测正弦序列。后来我们比较了LSTM和GRU的侧面。这一次我们将建议进一步阅读一篇有趣的论文该论文在自然语言处理的背景下分析GRU和LSTMs[3]由Yin et al. 2017撰写。 我们专注于理解RNN而不是在更花哨的应用程序中部署它们的实现层。 八、引用 [1] Greff K. Srivastava R. K. Koutník J. Steunebrink B. R. Schmidhuber J. 2016.LSTM搜索空间之旅。 IEEE Transactions on neural Network and Learning Systems 2810 2222–2232. [2] Chung J. Gulcehre C. Cho K. Bengio Y. 2014.门控递归神经网络在序列建模上的实证评估。arXiv预印本arXiv1412.3555。 [3] Yin W. Kann K. Yu M. Schütze H. 2017.用于自然语言处理的CNN和RNN的比较研究。arXiv预印本arXiv1702.01923。 [4] Esteban C. Hyland S. L. Rätsch G. 2017.具有递归条件 GAN 的实值医学时间序列生成。arXiv预印本arXiv1706.02633。 [5] 瓦斯瓦尼 沙泽尔 帕尔马 乌什科雷特 J. 琼斯 L. 戈麦斯 A. N. ...PolosukhinI.2017。注意力就是你所需要的。神经信息处理系统进展第5998-6008页。尼古拉斯·阿达洛格鲁 ·
http://www.w-s-a.com/news/325237/

相关文章:

  • 北京公司注册在哪个网站浏览器打开网址404
  • 廊坊做网站公司绣花图案设计网站
  • 网站空间租用哪个好购物网站建设模板图片
  • 建设银行包头分行网站泰安网签成交量最新
  • 手机微网站与微官网现在去成都需要隔离吗
  • 学校的二级网站怎么建设深圳企业网站制作设计
  • 自己做qq头像静态的网站网站建设是属于软件开发费吗
  • 举报网站建设做网站之前的工作
  • 用QQ群做网站排名个人网站制作协议
  • 做茶叶网站的素材天津网站营销
  • 网站设计建设流程图微信端的网站开发python
  • 湖州网站seo优化网站改域名备案
  • dedecms怎么制作网站合肥电商网站开发
  • 网站开发通用流程图做flash的网站
  • 营销型网站有哪些平台网站建设藤设计
  • 网站需求分析网站建设美食网站建设多少钱
  • 有专门做网站的吗建德网站
  • 做网站要买服务器吗单页设计思路
  • 一 电子商务网站建设规划网站开发前端框架和后端框架
  • 自助网站建设系统软件自己免费建设网站
  • 百度微建站access如何与网站连接数据库
  • ppt素材免费网站网站正能量晚上免费软件
  • 个人淘宝客网站如何备案搭建一个平台要多少钱
  • nginx 网站建设淘客网站怎么做首页
  • 网站制作的基本步骤是手机网站建设 新闻
  • 水墨 网站源码工装
  • 任丘网站建设服务网站 建设原则
  • 长沙做一个网站要多少钱网站底部备案代码
  • wordpress构建自定义设置页面seo培训学什么
  • 延安有哪些做网站的公司如何建设网站?