当前位置: 首页 > news >正文

动漫网站建设毕业设计稳重大气的公司名字

动漫网站建设毕业设计,稳重大气的公司名字,免费设计logo标志,前端工程师兼职平台文章目录 1、简介2、门控机制3、LSTM3.1、概念3.2、公式⭐3.3、特点 4、图解LSTM⭐4.1、RNN4.2、时间链条4.3、记忆单元#x1f53a;4.4、LSTM 5、LSTM与GRU的对比6、应用7、训练技巧 #x1f343;作者介绍#xff1a;双非本科大三网络工程专业在读#xff0c;阿里云专家博… 文章目录 1、简介2、门控机制3、LSTM3.1、概念3.2、公式⭐3.3、特点 4、图解LSTM⭐4.1、RNN4.2、时间链条4.3、记忆单元4.4、LSTM 5、LSTM与GRU的对比6、应用7、训练技巧 作者介绍双非本科大三网络工程专业在读阿里云专家博主专注于Java领域学习擅长web应用开发、数据结构和算法初步涉猎人工智能和前端开发。 个人主页逐梦苍穹 所属专栏人工智能 gitee地址xzl的人工智能代码仓库 ✈ 您的一键三连是我创作的最大动力 1、简介 长短时记忆网络LSTM和门控循环单元GRU是循环神经网络RNN的两种改进变体。 它们通过引入 门控机制 解决了RNN在处理长序列时的梯度消失和梯度爆炸问题。 先复习一下RNNhttps://xzl-tech.blog.csdn.net/article/details/140940642 有兴趣可以继续学习GRUhttps://xzl-tech.blog.csdn.net/article/details/140940794 2、门控机制 门控机制的基本思想是使用“门”来控制信息在网络中的流动。每个门都是通过神经网络层计算出来的权重向量其值通常在 0到1之间。不同的门在不同 时间步 上控制信息的选择、遗忘和更新。这些门是通过可学习的参数在训练过程中自动调整的。 3、LSTM LSTMLong Short-Term Memory 3.1、概念 LSTM是一种 特殊的RNN结构它通过引入记忆单元和门控机制来控制信息的流动以此解决长时依赖问题。 LSTM网络包含一个称为记忆单元cell state的特殊单元用于维护跨越时间步的长期信息。 记忆单元通过三种 门门控机制来控制信息的更新 输入门Input Gate决定哪些新信息需要被写入记忆单元。遗忘门Forget Gate决定哪些旧信息需要被从记忆单元中移除。输出门Output Gate决定从记忆单元中输出哪些信息。 3.2、公式⭐ 下文有图解此处看不懂可以先跳过 LSTM在每个时间步的更新过程可以用以下公式描述 遗忘门 f t σ ( W f ⋅ [ h t − 1 , x t ] b f ) f_t \sigma(W_f \cdot [h_{t-1}, x_t] b_f) ft​σ(Wf​⋅[ht−1​,xt​]bf​) f t f_t ft​ 表示遗忘门的输出。 σ \sigma σ 是sigmoid激活函数用于将输出值限制在0到1之间。 输入门 i t σ ( W i ⋅ [ h t − 1 , x t ] b i ) i_t \sigma(W_i \cdot [h_{t-1}, x_t] b_i) it​σ(Wi​⋅[ht−1​,xt​]bi​) i t i_t it​ 表示输入门的输出。 候选记忆单元更新 C ~ t tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] b C ) \tilde{C}_t \tanh(W_C \cdot [h_{t-1}, x_t] b_C) C~t​tanh(WC​⋅[ht−1​,xt​]bC​) C ~ t \tilde{C}_t C~t​ 表示候选的记忆单元状态。 记忆单元更新 C t f t ∗ C t − 1 i t ∗ C ~ t C_t f_t \ast C_{t-1} i_t \ast \tilde{C}_t Ct​ft​∗Ct−1​it​∗C~t​ C t C_t Ct​ 表示当前时间步的记忆单元状态。 输出门 o t σ ( W o ⋅ [ h t − 1 , x t ] b o ) o_t \sigma(W_o \cdot [h_{t-1}, x_t] b_o) ot​σ(Wo​⋅[ht−1​,xt​]bo​) o t o_t ot​ 表示输出门的输出。 隐藏状态更新 h t o t ∗ tanh ⁡ ( C t ) h_t o_t \ast \tanh(C_t) ht​ot​∗tanh(Ct​) h t h_t ht​ 是当前时间步的隐藏状态。 3.3、特点 有效捕获长时依赖LSTM通过门控机制有效地捕获序列数据中的长时依赖关系。复杂性相对于标准RNNLSTM的结构更为复杂计算量也更大。 4、图解LSTM⭐ 4.1、RNN 多维的角度 二维的角度 其实就是在原本的前馈神经网络中加入了时间的维度 4.2、时间链条 在原来的RNN的基础上LSTM就是增加了一条时间链条 C t C_t Ct​ 连起来 这个时间链条并不是跟 S t S_t St​隐藏层同平面的旋转一下即为 4.3、记忆单元 下面关于 S t S_t St​和 C t C_t Ct​的关系进行展开 S t S_t St​和 C t C_t Ct​这条线展开平面为 S t S_t St​和 C t C_t Ct​一条线拆成了三条线 那么关于 f 1 f_1 f1​和 f 2 f_2 f2​两个函数关系 f 1 σ ( W 1 ⋅ [ h t − 1 , x t ] b 1 ) f_1 \sigma(W_1 \cdot [h_{t-1}, x_t] b_1) f1​σ(W1​⋅[ht−1​,xt​]b1​) i t σ ( W 2 ⋅ [ h t − 1 , x t ] b 2 ) i_t \sigma(W_2 \cdot [h_{t-1}, x_t] b_2) it​σ(W2​⋅[ht−1​,xt​]b2​) C ~ t tanh ⁡ ( W ~ 2 ⋅ [ h t − 1 , x t ] b ~ 2 ) \tilde{C}_t \tanh(\tilde{W}_2 \cdot [h_{t-1}, x_t] \tilde{b}_2) C~t​tanh(W~2​⋅[ht−1​,xt​]b~2​) f 2 i t ∗ C ~ t f_2i_t*\tilde{C}_t f2​it​∗C~t​ C t f t ∗ C t − 1 i t ∗ C ~ t C_t f_t \ast C_{t-1} i_t \ast \tilde{C}_t Ct​ft​∗Ct−1​it​∗C~t​ 所以根据这张图以及上面的公式不难看出 图中的删除就是遗忘门 f t σ ( W f ⋅ [ h t − 1 , x t ] b f ) f_t \sigma(W_f \cdot [h_{t-1}, x_t] b_f) ft​σ(Wf​⋅[ht−1​,xt​]bf​) 图中的增加就是输入门 i t σ ( W i ⋅ [ h t − 1 , x t ] b i ) i_t \sigma(W_i \cdot [h_{t-1}, x_t] b_i) it​σ(Wi​⋅[ht−1​,xt​]bi​)和候选记忆单元更新 C ~ t tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] b C ) \tilde{C}_t \tanh(W_C \cdot [h_{t-1}, x_t] b_C) C~t​tanh(WC​⋅[ht−1​,xt​]bC​)的乘积 4.4、LSTM 关于LSTM有这么一张经典图 这张图展示了LSTM单元的详细结构包含了三个主要的门遗忘门、输入门和输出门以及记忆单元的更新过程。 从输入到输出LSTM单元通过门控机制控制信息的流动允许网络在长时间跨度内捕获依赖关系。 5、LSTM与GRU的对比 复杂性 LSTM更复杂参数更多。GRU较为简洁参数更少训练速度更快。 性能 两者在处理长时依赖性任务时表现都很优异具体选择往往取决于数据集和计算资源。在一些特定任务和数据集上GRU可能比LSTM表现更好尤其是在计算资源有限的情况下。 使用场景 对于需要更强的长期记忆和复杂信息流动的任务LSTM可能更合适。对于实时性要求较高或者模型简单性要求较高的任务GRU可能更具优势。 LSTM和GRU是两种非常成功的RNN变体通过改进信息传递机制有效解决了传统RNN在处理长序列数据时的局限性。 它们在自然语言处理、语音识别和时间序列预测等领域得到广泛应用。 6、应用 RNN及其变体广泛应用于以下领域 自然语言处理如语言模型、机器翻译和文本生成。语音识别将音频序列转换为文本。时间序列预测如股票价格预测和天气预报。视频分析从视频帧中提取时间信息。 7、训练技巧 梯度裁剪限制梯度的大小以防止梯度爆炸。正则化使用Dropout等技术防止过拟合。预训练和转移学习利用大规模预训练模型微调特定任务。 RNN模型在序列数据处理中具有强大的表现力和适应能力但也面临一些挑战。通过使用LSTM、GRU等改进模型结合适当的训练技巧能够有效地应用于各种实际问题。
http://www.w-s-a.com/news/657761/

相关文章:

  • 做物品租赁网站清新wordpress主题
  • 优秀专题网站家居企业网站建设市场
  • 中山市有什么网站推广wordpress轻应用主机
  • 洗头竖鞋带名片改良授权做网站不贵整个世界
  • 设计电子商务网站建设方案微信如何开发自己的小程序
  • 建设网站公司哪里好相关的热搜问题解决方案做网站要看什么书
  • 网站建设重要性黄岐建网站
  • 做网站电销《电子商务网站建设》精品课
  • 地方商城网站海外网站推广方法
  • 乐山 网站建设安阳给商家做网站推广
  • 网站空间一般多大邢台网站建设有哪些
  • h5网站开发工具有哪些wordpress清空post表
  • 公司开网站干嘛怎么制作一个免费的网站模板
  • 群晖wordpress搭建网站网站建设及管理
  • 中山企业网站建设公司抖音代运营合作模式
  • 南通营销网站开发做网站页面多少钱
  • 桂林生活网官方网站云主机和云电脑的区别
  • 内部网络网站怎么做vue做单页面网站
  • 如何建立网站教程wordpress粘帖图片
  • 广东网站备案要多久网站开发 pdf 文字版
  • 学校网站方案帮别人做钓鱼网站吗
  • 如何加强网站建设和信息宣传wordpress 搜索提示
  • 灰色网站怎么做php yaf 网站开发框架
  • 浙江建设网站首页提供做网站公司有哪些
  • 建公司网站报价公司seo是什么级别
  • 可信赖的武进网站建设中山网站建设方案
  • 网站设计方面有什么公司运动鞋网站建设目的
  • 学校门户网站流程建设方案找人做网站 多少钱
  • 网站域名更换相应内容网站策划 要求
  • 百盛联合建设集团网站开发网站的步骤