当前位置: 首页 > news >正文

专业做家政网站网站开发费计入什么会计科目

专业做家政网站,网站开发费计入什么会计科目,江西建设安全网站,西安网站建设价格明细学习参考#xff1a; 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)#xff0c;以达到集多方教程的精华于一文的目的。 ③非常推荐上面#xff08;学习参考#x…学习参考 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)以达到集多方教程的精华于一文的目的。 ③非常推荐上面学习参考的前两个教程在网上是开源免费的写的很棒不管是开始学还是复习巩固都很不错的。 深度学习回顾专栏内容来源多个书籍笔记、在线笔记、以及自己的感想、想法佛系更新。争取内容全面而不失重点。完结时间到了也会一直更新下去已写完的笔记文章会不定时一直修订修改(删、改、增)以达到集多方教程的精华于一文的目的。所有文章涉及的教程都会写在开头、一起学习一起进步。 一、数值稳定性的重要性 到目前为止实现的每个模型都是根据某个预先指定的分布来初始化模型的参数。 有人会认为初始化方案是理所当然的忽略了如何做出这些选择的细节。甚至有人可能会觉得初始化方案的选择并不是特别重要。 相反初始化方案的选择在神经网络学习中起着举足轻重的作用 它对保持数值稳定性至关重要。 此外这些初始化方案的选择可以与非线性激活函数的选择有趣的结合在一起。 选择哪个函数以及如何初始化参数可以决定优化算法收敛的速度有多快。 糟糕选择可能会导致我们在训练时遇到梯度爆炸或梯度消失。 考虑一个具有 层、输入 和输出 的深层网络。 每一层 由变换 定义 该变换的参数为权重 () 其隐藏变量是 ()令 (0)。 网络可以表示为 如果所有隐藏变量和输入都是向量 可以将 关于任何一组参数 () 的梯度写为下式该梯度是 − 个矩阵 ()⋅…⋅(1) 与梯度向量 () 的乘积。 因此上面公式计算的结果容易受到数值下溢问题的影响. 当将太多的概率乘在一起时这些问题经常会出现。 在处理概率时一个常见的技巧是切换到对数空间 即将数值表示的压力从尾数转移到指数。 不幸的是上面的问题更为严重 最初矩阵 () 可能具有各种各样的特征值。 他们可能很小也可能很大 他们的乘积可能非常大也可能非常小。 不稳定梯度带来的风险不止在于数值表示 不稳定梯度也威胁到优化算法的稳定性。 可能面临一些问题 梯度爆炸gradient exploding问题 参数更新过大破坏了模型的稳定收敛梯度消失gradient vanishing问题 参数更新过小在每次更新时几乎不会移动导致模型无法学习。 二、梯度消失 在深度神经网络中梯度消失指的是在反向传播过程中梯度逐渐变小并接近零导致较深层的网络参数无法得到有效更新从而影响模型的训练效果。 梯度消失通常发生在使用激活函数导数具有较小值的情况下尤其是在使用 sigmoid 或 tanh 激活函数时。 sigmoid函数 1/(1exp(−))很流行 因为它类似于阈值函数。 由于早期的人工神经网络受到生物神经网络的启发 神经元要么完全激活要么完全不激活就像生物神经元的想法很有吸引力。 然而它却是导致梯度消失问题的一个常见的原因。下图是sigmoid函数变化图和梯度变化图。 %matplotlib inline import tensorflow as tf from d2l import tensorflow as d2lx tf.Variable(tf.range(-8.0, 8.0, 0.1)) with tf.GradientTape() as t:y tf.nn.sigmoid(x) d2l.plot(x.numpy(), [y.numpy(), t.gradient(y, x).numpy()],legend[sigmoid, gradient], figsize(4.5, 2.5))当sigmoid函数的输入很大或是很小时它的梯度都会消失。 此外当反向传播通过许多层时除非在刚刚好的地方 这些地方sigmoid函数的输入接近于零否则整个乘积的梯度可能会消失。 当网络有很多层时除非很小心否则在某一层可能会切断梯度。 事实上这个问题曾经困扰着深度网络的训练。 因此更稳定的ReLU系列函数已经成为从业者的默认选择虽然在神经科学的角度看起来不太合理。 三、梯度爆炸 梯度爆炸则是指在反向传播过程中梯度变得非常大超过了数值范围导致参数更新过大模型无法稳定训练。 梯度爆炸通常出现在网络层数较多、权重初始化不当或者学习率设置过高的情况下。 相反梯度爆炸可能同样令人烦恼。 为了更好地说明这一点生成100个高斯随机矩阵并将它们与某个初始矩阵相乘。 对于我们选择的尺度方差 ²1 矩阵乘积发生爆炸。 当这种情况是由于深度网络的初始化所导致时导致没有机会让梯度下降优化器收敛。 M tf.random.normal((4, 4)) print(一个矩阵 \n, M) for i in range(100):M tf.matmul(M, tf.random.normal((4, 4)))print(乘以100个矩阵后\n, M.numpy())一个矩阵 tf.Tensor( [[ 3.7436965 2.652792 0.5994665 -0.17366047][ 0.6720035 -0.7297903 0.3705189 -0.5043682 ][ 0.53814566 -0.94948226 0.09689955 -0.4441989 ][ 0.6737587 0.41651404 -0.9230542 0.1903977 ]], shape(4, 4), dtypefloat32) 乘以100个矩阵后[[-1.9263415e26 1.5658991e27 3.4174752e26 -9.1476850e25][ 1.4916346e24 -1.2148971e25 -2.6495698e24 7.0983965e23][ 2.5503458e25 -2.0726612e26 -4.5202026e25 1.2112884e25][ 1.2258523e25 -9.9649782e25 -2.1730161e25 5.8238054e24]]四、解决梯度消失和梯度爆炸的方法 梯度裁剪Gradient Clipping限制梯度的大小防止梯度爆炸。使用恰当的激活函数如 ReLU 可以缓解梯度消失问题。参数初始化使用合适的参数初始化方法如 Xavier 或 He 初始化。批归一化Batch Normalization通过规范化每层输入有助于缓解梯度消失和梯度爆炸问题。残差连接Residual Connections在深层网络中使用残差连接有助于减轻梯度消失问题。 五、模型参数初始化 解决或至少减轻上述问题梯度消失、梯度爆炸的一种方法是进行参数初始化 优化期间的注意和适当的正则化也可以进一步提高稳定性。 选择适当的参数初始化方法取决于网络的结构、激活函数的选择以及具体任务的要求。良好的参数初始化可以帮助加速模型的收敛速度提高模型的性能并有助于避免梯度消失和梯度爆炸等问题。 1.默认初始化 使用正态分布来初始化权重值。如果不指定初始化方法 框架将使用默认的随机初始化方法对于中等难度的问题这种方法通常很有效。 2.Xavier初始化 Xavier初始化Xavier Initialization也称为Glorot初始化根据输入和输出的神经元数量来初始化参数。这种方法旨在使每一层的激活值保持在一个合理的范围内有助于避免梯度消失和梯度爆炸问题。 3.He初始化He Initialization 与Xavier初始化类似但是在计算方差时只考虑了输入神经元的数量适用于使用ReLU激活函数的网络。 4.正交初始化Orthogonal Initialization 通过生成一个正交矩阵来初始化权重有助于避免梯度消失和梯度爆炸问题。 5.自适应方法Adaptive Methods 如自适应矩估计Adagrad、RMSProp、Adam等优化算法这些算法在训练过程中会自动调整学习率有助于更好地初始化参数。 6.其它 深度学习框架通常实现十几种不同的启发式方法。 此外参数初始化一直是深度学习基础研究的热点领域。 其中包括专门用于参数绑定共享、超分辨率、序列模型和其他情况的启发式算法。
http://www.w-s-a.com/news/214084/

相关文章:

  • 自己怎么用h5做网站肇庆seo
  • 长沙网站seo优化公司东莞企业官方网站建设
  • 网站个人备案材料北京网站推广价格
  • 百度做任务的网站电子工程网网站
  • 中介订制网站开发玉溪网站建设设计
  • 免费网站免费无遮挡手机页面设计软件
  • 网站建设需求规格说明书中山模板建站公司
  • wordpress get值网站建设 seo sem
  • 网站建设微信开发工厂代加工平台
  • 厦门 网站建设 公司哪家好asp.net 创建网站
  • 专业北京网站建设凡科网做网站怎么样
  • 金富通青岛建设工程有限公司网站浙江省住建厅四库一平台
  • 有搜索引擎作弊的网站企业建设H5响应式网站的5大好处6
  • 是做网站编辑还是做平面设计seo外包公司接单
  • 做性的网站有哪些苏州专业网站设计制作公司
  • 陵水网站建设友创科技十大优品店排名
  • 想换掉做网站的公司简要说明网站制作的基本步骤
  • 国企公司网站制作wordpress 浮动定位
  • 网站网页直播怎么做的企业网站建设推荐兴田德润
  • 网站建设熊猫建站厦门seo全网营销
  • 扁平网站设计seo是什么岗位的缩写
  • 工商企业网站群晖配置wordpress 80端口
  • 企业网站建设流程步骤镇江东翔网络科技有限公司
  • 网络工程师和做网站哪个难网络建站如何建成
  • 网站建设需要哪些项目游民星空是用什么做的网站
  • 旅游网站建设要如何做百度商城网站建设
  • destoon 网站搬家中国企业500强都有哪些企业
  • 商城网站前端更新商品天天做吗哈尔滨做网站优化
  • 新乡网站开发wordpress 产品分类侧边栏
  • 网站自己做自己的品牌好做互联网企业分类