当前位置: 首页 > news >正文

做p2p网站建网站 技术

做p2p网站,建网站 技术,泰州网站制作推广,网站设计 三把火科技学习参考#xff1a; 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)#xff0c;以达到集多方教程的精华于一文的目的。 ③非常推荐上面#xff08;学习参考#x…学习参考 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)以达到集多方教程的精华于一文的目的。 ③非常推荐上面学习参考的前两个教程在网上是开源免费的写的很棒不管是开始学还是复习巩固都很不错的。 深度学习回顾专栏内容来源多个书籍笔记、在线笔记、以及自己的感想、想法佛系更新。争取内容全面而不失重点。完结时间到了也会一直更新下去已写完的笔记文章会不定时一直修订修改(删、改、增)以达到集多方教程的精华于一文的目的。所有文章涉及的教程都会写在开头、一起学习一起进步。 一、数值稳定性的重要性 到目前为止实现的每个模型都是根据某个预先指定的分布来初始化模型的参数。 有人会认为初始化方案是理所当然的忽略了如何做出这些选择的细节。甚至有人可能会觉得初始化方案的选择并不是特别重要。 相反初始化方案的选择在神经网络学习中起着举足轻重的作用 它对保持数值稳定性至关重要。 此外这些初始化方案的选择可以与非线性激活函数的选择有趣的结合在一起。 选择哪个函数以及如何初始化参数可以决定优化算法收敛的速度有多快。 糟糕选择可能会导致我们在训练时遇到梯度爆炸或梯度消失。 考虑一个具有 层、输入 和输出 的深层网络。 每一层 由变换 定义 该变换的参数为权重 () 其隐藏变量是 ()令 (0)。 网络可以表示为 如果所有隐藏变量和输入都是向量 可以将 关于任何一组参数 () 的梯度写为下式该梯度是 − 个矩阵 ()⋅…⋅(1) 与梯度向量 () 的乘积。 因此上面公式计算的结果容易受到数值下溢问题的影响. 当将太多的概率乘在一起时这些问题经常会出现。 在处理概率时一个常见的技巧是切换到对数空间 即将数值表示的压力从尾数转移到指数。 不幸的是上面的问题更为严重 最初矩阵 () 可能具有各种各样的特征值。 他们可能很小也可能很大 他们的乘积可能非常大也可能非常小。 不稳定梯度带来的风险不止在于数值表示 不稳定梯度也威胁到优化算法的稳定性。 可能面临一些问题 梯度爆炸gradient exploding问题 参数更新过大破坏了模型的稳定收敛梯度消失gradient vanishing问题 参数更新过小在每次更新时几乎不会移动导致模型无法学习。 二、梯度消失 在深度神经网络中梯度消失指的是在反向传播过程中梯度逐渐变小并接近零导致较深层的网络参数无法得到有效更新从而影响模型的训练效果。 梯度消失通常发生在使用激活函数导数具有较小值的情况下尤其是在使用 sigmoid 或 tanh 激活函数时。 sigmoid函数 1/(1exp(−))很流行 因为它类似于阈值函数。 由于早期的人工神经网络受到生物神经网络的启发 神经元要么完全激活要么完全不激活就像生物神经元的想法很有吸引力。 然而它却是导致梯度消失问题的一个常见的原因。下图是sigmoid函数变化图和梯度变化图。 %matplotlib inline import tensorflow as tf from d2l import tensorflow as d2lx tf.Variable(tf.range(-8.0, 8.0, 0.1)) with tf.GradientTape() as t:y tf.nn.sigmoid(x) d2l.plot(x.numpy(), [y.numpy(), t.gradient(y, x).numpy()],legend[sigmoid, gradient], figsize(4.5, 2.5))当sigmoid函数的输入很大或是很小时它的梯度都会消失。 此外当反向传播通过许多层时除非在刚刚好的地方 这些地方sigmoid函数的输入接近于零否则整个乘积的梯度可能会消失。 当网络有很多层时除非很小心否则在某一层可能会切断梯度。 事实上这个问题曾经困扰着深度网络的训练。 因此更稳定的ReLU系列函数已经成为从业者的默认选择虽然在神经科学的角度看起来不太合理。 三、梯度爆炸 梯度爆炸则是指在反向传播过程中梯度变得非常大超过了数值范围导致参数更新过大模型无法稳定训练。 梯度爆炸通常出现在网络层数较多、权重初始化不当或者学习率设置过高的情况下。 相反梯度爆炸可能同样令人烦恼。 为了更好地说明这一点生成100个高斯随机矩阵并将它们与某个初始矩阵相乘。 对于我们选择的尺度方差 ²1 矩阵乘积发生爆炸。 当这种情况是由于深度网络的初始化所导致时导致没有机会让梯度下降优化器收敛。 M tf.random.normal((4, 4)) print(一个矩阵 \n, M) for i in range(100):M tf.matmul(M, tf.random.normal((4, 4)))print(乘以100个矩阵后\n, M.numpy())一个矩阵 tf.Tensor( [[ 3.7436965 2.652792 0.5994665 -0.17366047][ 0.6720035 -0.7297903 0.3705189 -0.5043682 ][ 0.53814566 -0.94948226 0.09689955 -0.4441989 ][ 0.6737587 0.41651404 -0.9230542 0.1903977 ]], shape(4, 4), dtypefloat32) 乘以100个矩阵后[[-1.9263415e26 1.5658991e27 3.4174752e26 -9.1476850e25][ 1.4916346e24 -1.2148971e25 -2.6495698e24 7.0983965e23][ 2.5503458e25 -2.0726612e26 -4.5202026e25 1.2112884e25][ 1.2258523e25 -9.9649782e25 -2.1730161e25 5.8238054e24]]四、解决梯度消失和梯度爆炸的方法 梯度裁剪Gradient Clipping限制梯度的大小防止梯度爆炸。使用恰当的激活函数如 ReLU 可以缓解梯度消失问题。参数初始化使用合适的参数初始化方法如 Xavier 或 He 初始化。批归一化Batch Normalization通过规范化每层输入有助于缓解梯度消失和梯度爆炸问题。残差连接Residual Connections在深层网络中使用残差连接有助于减轻梯度消失问题。 五、模型参数初始化 解决或至少减轻上述问题梯度消失、梯度爆炸的一种方法是进行参数初始化 优化期间的注意和适当的正则化也可以进一步提高稳定性。 选择适当的参数初始化方法取决于网络的结构、激活函数的选择以及具体任务的要求。良好的参数初始化可以帮助加速模型的收敛速度提高模型的性能并有助于避免梯度消失和梯度爆炸等问题。 1.默认初始化 使用正态分布来初始化权重值。如果不指定初始化方法 框架将使用默认的随机初始化方法对于中等难度的问题这种方法通常很有效。 2.Xavier初始化 Xavier初始化Xavier Initialization也称为Glorot初始化根据输入和输出的神经元数量来初始化参数。这种方法旨在使每一层的激活值保持在一个合理的范围内有助于避免梯度消失和梯度爆炸问题。 3.He初始化He Initialization 与Xavier初始化类似但是在计算方差时只考虑了输入神经元的数量适用于使用ReLU激活函数的网络。 4.正交初始化Orthogonal Initialization 通过生成一个正交矩阵来初始化权重有助于避免梯度消失和梯度爆炸问题。 5.自适应方法Adaptive Methods 如自适应矩估计Adagrad、RMSProp、Adam等优化算法这些算法在训练过程中会自动调整学习率有助于更好地初始化参数。 6.其它 深度学习框架通常实现十几种不同的启发式方法。 此外参数初始化一直是深度学习基础研究的热点领域。 其中包括专门用于参数绑定共享、超分辨率、序列模型和其他情况的启发式算法。
http://www.w-s-a.com/news/910730/

相关文章:

  • 知名网站建设公司电话长子网站建设
  • 网站建设的意义与目的建立什么船籍港
  • 广州注册公司营业执照网站建设代码优化
  • 百度网站官网马克互联网主题 wordpress
  • 网站制作 客户刁难深圳自助建站
  • 怎么去推广一个网站广东餐饮品牌设计
  • 网站代码加密了怎么做兰州最新大事
  • 现在ui做的比较好的网站去年做啥网站致富
  • 广东网站建设咨询电话好牌子网
  • 公司怎样制作网站南阳网站关键词
  • 营销型网站建设与网盟完整php网站开发
  • 网站做微信链接怎么做的石桥铺网站建设公司
  • 济南mip网站建设公司做图书馆网站模板
  • app 门户网站网站项目框架
  • 做网站视频网站备案 新闻审批号
  • 织梦网站怎么居中视频网站开发与制作
  • 网站上海备案佛山网站seo哪家好
  • 品牌形象网站有哪些珠海市区工商年报在哪个网站做
  • 注册域名不建设网站seo外包服务方案
  • 如何进行外贸网站建设wordpress文章输入密码可见
  • 政务网站建设索引常州做网站信息
  • 南宁做网站找哪家好wordpress 更改首页
  • 一个人在家做网站建设品牌策划流程
  • 小网站广告投放wordpress页面添加js
  • 仿制别人的竞价网站做竞价犯法吗wordpress添加版块
  • wordpress主题 站长互联网站备案表
  • 广州品牌策划公司排行南宁seo网络推广公司
  • 营销型网站图片肯德基网站开发
  • 网站的外链是什么wordpress开启菜单
  • 文字字体是什么网站西安博达网站建设