当前位置: 首页 > news >正文

林州网站建设策划二维码生成器使用方法

林州网站建设策划,二维码生成器使用方法,wordpress 积分商城,网站程序下载文章目录 1、简介2、门控机制3、LSTM3.1、概念3.2、公式⭐3.3、特点 4、图解LSTM⭐4.1、RNN4.2、时间链条4.3、记忆单元#x1f53a;4.4、LSTM 5、LSTM与GRU的对比6、应用7、训练技巧 #x1f343;作者介绍#xff1a;双非本科大三网络工程专业在读#xff0c;阿里云专家博… 文章目录 1、简介2、门控机制3、LSTM3.1、概念3.2、公式⭐3.3、特点 4、图解LSTM⭐4.1、RNN4.2、时间链条4.3、记忆单元4.4、LSTM 5、LSTM与GRU的对比6、应用7、训练技巧 作者介绍双非本科大三网络工程专业在读阿里云专家博主专注于Java领域学习擅长web应用开发、数据结构和算法初步涉猎人工智能和前端开发。 个人主页逐梦苍穹 所属专栏人工智能 gitee地址xzl的人工智能代码仓库 ✈ 您的一键三连是我创作的最大动力 1、简介 长短时记忆网络LSTM和门控循环单元GRU是循环神经网络RNN的两种改进变体。 它们通过引入 门控机制 解决了RNN在处理长序列时的梯度消失和梯度爆炸问题。 先复习一下RNNhttps://xzl-tech.blog.csdn.net/article/details/140940642 有兴趣可以继续学习GRUhttps://xzl-tech.blog.csdn.net/article/details/140940794 2、门控机制 门控机制的基本思想是使用“门”来控制信息在网络中的流动。每个门都是通过神经网络层计算出来的权重向量其值通常在 0到1之间。不同的门在不同 时间步 上控制信息的选择、遗忘和更新。这些门是通过可学习的参数在训练过程中自动调整的。 3、LSTM LSTMLong Short-Term Memory 3.1、概念 LSTM是一种 特殊的RNN结构它通过引入记忆单元和门控机制来控制信息的流动以此解决长时依赖问题。 LSTM网络包含一个称为记忆单元cell state的特殊单元用于维护跨越时间步的长期信息。 记忆单元通过三种 门门控机制来控制信息的更新 输入门Input Gate决定哪些新信息需要被写入记忆单元。遗忘门Forget Gate决定哪些旧信息需要被从记忆单元中移除。输出门Output Gate决定从记忆单元中输出哪些信息。 3.2、公式⭐ 下文有图解此处看不懂可以先跳过 LSTM在每个时间步的更新过程可以用以下公式描述 遗忘门 f t σ ( W f ⋅ [ h t − 1 , x t ] b f ) f_t \sigma(W_f \cdot [h_{t-1}, x_t] b_f) ft​σ(Wf​⋅[ht−1​,xt​]bf​) f t f_t ft​ 表示遗忘门的输出。 σ \sigma σ 是sigmoid激活函数用于将输出值限制在0到1之间。 输入门 i t σ ( W i ⋅ [ h t − 1 , x t ] b i ) i_t \sigma(W_i \cdot [h_{t-1}, x_t] b_i) it​σ(Wi​⋅[ht−1​,xt​]bi​) i t i_t it​ 表示输入门的输出。 候选记忆单元更新 C ~ t tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] b C ) \tilde{C}_t \tanh(W_C \cdot [h_{t-1}, x_t] b_C) C~t​tanh(WC​⋅[ht−1​,xt​]bC​) C ~ t \tilde{C}_t C~t​ 表示候选的记忆单元状态。 记忆单元更新 C t f t ∗ C t − 1 i t ∗ C ~ t C_t f_t \ast C_{t-1} i_t \ast \tilde{C}_t Ct​ft​∗Ct−1​it​∗C~t​ C t C_t Ct​ 表示当前时间步的记忆单元状态。 输出门 o t σ ( W o ⋅ [ h t − 1 , x t ] b o ) o_t \sigma(W_o \cdot [h_{t-1}, x_t] b_o) ot​σ(Wo​⋅[ht−1​,xt​]bo​) o t o_t ot​ 表示输出门的输出。 隐藏状态更新 h t o t ∗ tanh ⁡ ( C t ) h_t o_t \ast \tanh(C_t) ht​ot​∗tanh(Ct​) h t h_t ht​ 是当前时间步的隐藏状态。 3.3、特点 有效捕获长时依赖LSTM通过门控机制有效地捕获序列数据中的长时依赖关系。复杂性相对于标准RNNLSTM的结构更为复杂计算量也更大。 4、图解LSTM⭐ 4.1、RNN 多维的角度 二维的角度 其实就是在原本的前馈神经网络中加入了时间的维度 4.2、时间链条 在原来的RNN的基础上LSTM就是增加了一条时间链条 C t C_t Ct​ 连起来 这个时间链条并不是跟 S t S_t St​隐藏层同平面的旋转一下即为 4.3、记忆单元 下面关于 S t S_t St​和 C t C_t Ct​的关系进行展开 S t S_t St​和 C t C_t Ct​这条线展开平面为 S t S_t St​和 C t C_t Ct​一条线拆成了三条线 那么关于 f 1 f_1 f1​和 f 2 f_2 f2​两个函数关系 f 1 σ ( W 1 ⋅ [ h t − 1 , x t ] b 1 ) f_1 \sigma(W_1 \cdot [h_{t-1}, x_t] b_1) f1​σ(W1​⋅[ht−1​,xt​]b1​) i t σ ( W 2 ⋅ [ h t − 1 , x t ] b 2 ) i_t \sigma(W_2 \cdot [h_{t-1}, x_t] b_2) it​σ(W2​⋅[ht−1​,xt​]b2​) C ~ t tanh ⁡ ( W ~ 2 ⋅ [ h t − 1 , x t ] b ~ 2 ) \tilde{C}_t \tanh(\tilde{W}_2 \cdot [h_{t-1}, x_t] \tilde{b}_2) C~t​tanh(W~2​⋅[ht−1​,xt​]b~2​) f 2 i t ∗ C ~ t f_2i_t*\tilde{C}_t f2​it​∗C~t​ C t f t ∗ C t − 1 i t ∗ C ~ t C_t f_t \ast C_{t-1} i_t \ast \tilde{C}_t Ct​ft​∗Ct−1​it​∗C~t​ 所以根据这张图以及上面的公式不难看出 图中的删除就是遗忘门 f t σ ( W f ⋅ [ h t − 1 , x t ] b f ) f_t \sigma(W_f \cdot [h_{t-1}, x_t] b_f) ft​σ(Wf​⋅[ht−1​,xt​]bf​) 图中的增加就是输入门 i t σ ( W i ⋅ [ h t − 1 , x t ] b i ) i_t \sigma(W_i \cdot [h_{t-1}, x_t] b_i) it​σ(Wi​⋅[ht−1​,xt​]bi​)和候选记忆单元更新 C ~ t tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] b C ) \tilde{C}_t \tanh(W_C \cdot [h_{t-1}, x_t] b_C) C~t​tanh(WC​⋅[ht−1​,xt​]bC​)的乘积 4.4、LSTM 关于LSTM有这么一张经典图 这张图展示了LSTM单元的详细结构包含了三个主要的门遗忘门、输入门和输出门以及记忆单元的更新过程。 从输入到输出LSTM单元通过门控机制控制信息的流动允许网络在长时间跨度内捕获依赖关系。 5、LSTM与GRU的对比 复杂性 LSTM更复杂参数更多。GRU较为简洁参数更少训练速度更快。 性能 两者在处理长时依赖性任务时表现都很优异具体选择往往取决于数据集和计算资源。在一些特定任务和数据集上GRU可能比LSTM表现更好尤其是在计算资源有限的情况下。 使用场景 对于需要更强的长期记忆和复杂信息流动的任务LSTM可能更合适。对于实时性要求较高或者模型简单性要求较高的任务GRU可能更具优势。 LSTM和GRU是两种非常成功的RNN变体通过改进信息传递机制有效解决了传统RNN在处理长序列数据时的局限性。 它们在自然语言处理、语音识别和时间序列预测等领域得到广泛应用。 6、应用 RNN及其变体广泛应用于以下领域 自然语言处理如语言模型、机器翻译和文本生成。语音识别将音频序列转换为文本。时间序列预测如股票价格预测和天气预报。视频分析从视频帧中提取时间信息。 7、训练技巧 梯度裁剪限制梯度的大小以防止梯度爆炸。正则化使用Dropout等技术防止过拟合。预训练和转移学习利用大规模预训练模型微调特定任务。 RNN模型在序列数据处理中具有强大的表现力和适应能力但也面临一些挑战。通过使用LSTM、GRU等改进模型结合适当的训练技巧能够有效地应用于各种实际问题。
http://www.w-s-a.com/news/454313/

相关文章:

  • 深圳网站建设服务哪家有织梦网站模板安装
  • 网站设计与网页制作代码大全网站开发还找到工作吗
  • 给设计网站做图会字体侵权吗站长工具seo综合查询张家界新娘
  • 网站的建设与颜色搭配win7在iis中新建一个网站
  • 单位做网站有哪些功能型类的网站
  • 网站怎样做优惠卷移动互联网开发培训
  • 重庆网站建设帝维科技网站做定向的作用
  • 网站建设工作室wp主题模板做污事网站
  • 网站建设 深圳 凡科重庆家居网站制作公司
  • 自己也可以免费轻松创建一个网站企业收录网站有什么用
  • 帮别人做网站违法导航网站开发工具
  • seo网站外包公司字画价格网站建设方案
  • 网站国内空间价格销售技巧
  • 广安建设企业网站qq互联网站备案号
  • 京东网站建设的要求vs2010做的网站
  • wordpress 新闻杂志主题佛山企业网站排名优化
  • 选服务好的网站建设金华市开发区人才网
  • 广州建站商城南阳高质量建设大城市网站
  • 网站建设合同封面模板做代炼的网站
  • 外贸网站建站要多少钱南昌优化排名推广
  • 做公司网站的尺寸一般是多大企业管理网站
  • 苏州网站设计公司兴田德润i简介做签证宾馆订单用啥网站
  • 网站页面设计工具做网站租空间
  • 做智能网站系统百度提交入口
  • 网站建设代理商电话网站规划和建设方案
  • 双桥区网站制作seo 首页
  • 电子商务网站建设前期准备wordpress域名指向二级目录
  • 汕头建站网站模板淮北做网站电话
  • 手机做logo用什么网站服务器安全防护
  • 课程分销的网站怎么做北京企业网站建设方案