当前位置: 首页 > news >正文

邯郸个人网站建设晋江网站建设哪家好

邯郸个人网站建设,晋江网站建设哪家好,iis网站重定向,免费ppt模板官网惭愧惭愧#xff01;机器学习中的数学原理这个专栏已经很久没有更新了#xff01;前段时间一直在学习深度学习#xff0c;paddlepaddle#xff0c;刷题专栏跟新了#xff0c;这个专栏就被打入冷宫了。这个专栏名为白话机器学习中数学学习笔记#xff0c;主要是用来分享一… 惭愧惭愧机器学习中的数学原理这个专栏已经很久没有更新了前段时间一直在学习深度学习paddlepaddle刷题专栏跟新了这个专栏就被打入冷宫了。这个专栏名为白话机器学习中数学学习笔记主要是用来分享一下我在 机器学习中的学习笔记及一些感悟也希望对你的学习有帮助哦感兴趣的小伙伴欢迎私信或者评论区留言这一篇就更新一下《 白话机器学习中的数学——模型评估与交叉验证》 文章目录一、什么是模型评估二、交叉验证2.1回归问题的交叉验证2.2分类问题的验证一、什么是模型评估 简单的讲模型评估就是评估训练好的模型的好坏。 在进行回归和分类时为了进行预测我们定义了函数 fθ(x)然后根据训练数据求出了函数的参数 θ。也就是对目标函数进行微分然后求出参数更新表达式的操作当时我们求出参数更新表达式之后就结束了。 但是其实我们真正想要的是通过预测函数得到预测值。以回归的那个例子来说就是关于投入的广告费能带来多少点击量的预测值。所以我们希望 fθ(x)对未知数据 x 输出的预测值尽可能正确。那我们如何测量预测函数 fθ(x)的正确性也就是精度呢对于一个变量的问题我可以用图直观的表示出来像多重回归这样的问题变量增加后就不能在图上展示了而且特意去画图也很麻烦。所以我们需要能够定量地表示机器学习模型的精度。 接下来我们就要考虑评估模型的方法。 二、交叉验证 验证是指的在机器学习模型训练时对模型好坏程度的衡量。交叉验证就是一种常用的模型选择方法使用部分数据集进行验证模型的有效性。 2.1回归问题的交叉验证 把获取的全部训练数据分成两份一份用于测试一份用于训练。然后用前者来评估模型。也就是说假如有 10 个训练数据那么实际上会按照 5 个测试数据、5 个训练数据来分配它们但是比起 5 : 5大多数情况会采用 3 : 7 或者 2 : 8 这种训练数据更多的比例。 我们接下来用3 个用于测试、7 个用于训练。也就是说关于点击量预测的回归问题我们现在有 10 个数据其中测试数据和训练数据是这样分配的右侧的 3 个是测试数据、左侧的 7 个是训练数据。首先我们来考虑使用左侧这 7 个数据来训练参数的情况。用一次函数 fθ(x)θ0θ1x∗f_{\boldsymbol{\theta}}(\boldsymbol{x})\theta_0\theta_1 x^*fθ​(x)θ0​θ1​x∗表示即可。先从一次函数开始考虑比较好。先不去管测试数据只看那7个训练数据。一次拟合函数大概如下 再考虑二次函数 如果 fθ(x)是二次函数那它基本上就是这个形状。但是这个函数“只有对训练数据才是正确的”对于测试集的预测效果很差。也就是说如果只看训练数据那么二次函数比一次函数拟合得更好。 但是如果将测试数据也考虑进来那么二次函数就完全不行了。要把测试数据当作未知数据来考虑。即使模型相同如果训练数据过少这种现象也会发生。那么在训练结束之后我们还得像这样检查一下测试数据是否也拟合但是如果变量增加就不能画图了。就算能画图也会很麻烦。 对于回归的情况只要在训练好的模型上计算测试数据的误差的平方再取其平均值就可以了。假设测试数据有 n 个那么可以这样计算。 1n∑i1n(y(i)−fθ(x(i)))2\frac{1}{n} \sum_{i1}^n\left(y^{(i)}-f_{\boldsymbol{\theta}}\left(\boldsymbol{x}^{(i)}\right)\right)^2n1​∑i1n​(y(i)−fθ​(x(i)))2 对于预测点击量的回归问题来说y(i) 就是点击量而 x(i) 是广告费或广告版面的大小这个值被称为均方误差或者 MSE全称 Mean Square Error。这个误差越小精度就越高模型也就越好。 回归的目标函数也是误差函数这与为了让误差函数的值变小而更新参数时所做的事情是一样的 2.2分类问题的验证 与回归的时候一样我们先考虑数据的分配。 数据的分配方法不要太极端其实会更好”这一点与回归的时候也是一样的。假设在逻辑回归的情况下θTx 是简单的一次函数那么只根据训练数据进行训练后决策边界应该是这样的: 但是假如θTx 更加复杂可能就会像这样紧贴着训练数据进行分类: 可以看到可以对训练数据完美地进行分类却完全忽视了测试数据。对于分类有别的指标。由于回归是连续值所以可以从误差入手但是在分类中我们必须要考虑分类的类别是否正确。在回归中要考虑的是答案不完全一致时的误差而分类中要考虑的是答案是否正确。 我们对图像是横向的还是纵向的进行了分类我们是根据图像为横向的概率来分类的。关于分类是否成功就会有下面 4 种情况 图像是横向的被正确分类了图像被分类为横向但实际上不是横向的图像不是横向的被正确分类了图像被分类为非横向但实际上是横向的 把它整理到这样的表里 设横向的情况为正、非横向的情况为负那么一般来说二分类的结果可以用这张表来表示 分类结果为正的情况是 Positive、为负的情况是 Negative。分类成功为 True、分类失败为 False。我们可以使用表里的 4 个记号来计算分类的精度。精度的英文是 Accuracy它的计算表达式是这样的 它表示的是在整个数据集中被正确分类的数据 TP 和 TN 所占的比例。假如 100 个数据中 80 个被正确地分类了那么精度就是这样的 用测试数据来计算这个值值越高精度越高也就意味着模型越好
http://www.w-s-a.com/news/795254/

相关文章:

  • 商业网站网站建设wordpress关闭前端公共库
  • 打开山东城市建设职业学院网站下载了wordpress后
  • 四川网站建设设计城乡建设网站证件查询系统
  • 企业邮箱哪里买栾城seo整站排名
  • 长沙网站建设zh68网页制作技术实训报告
  • 电商网站的功能手机广告设计与制作软件
  • 做网站前端需要编程基础吗杭州市住房和城乡建设局
  • 网站开发一般学多久网站建设投标方案
  • 北京网站建设报价表制作短视频的软件有哪些
  • 长沙企业网站开发西安建设公司网站
  • 做图的兼职网站网站开发用了哪些知识要点
  • php网站怎么做静态化微慕wordpress插件
  • 电商营业执照wordpress利于seo
  • 那些网站主做玄幻小说营销策略都有哪些方面
  • 同一源代码再建设一个网站建立网站免费
  • 网站更换服务器影响做seo必须有网站吗
  • 免费网页模板网站php微信微网站怎么做
  • 网站的优点和缺点腾讯企点是什么软件
  • 谷歌英文网站推广网页设计好看的网站
  • 衡水网站建设集团各大网站注册
  • 违法网站开发做注册任务网站源码
  • 帝国cms仿站工具淮南寿县
  • 深圳网站建设方案外包手机怎样使用域名访问网站
  • 安陆市建设局网站磐安做网站
  • 梧州市建设局官方网站商旅100网页版
  • 好的宝安网站建设中企动力的网站开发语言
  • flash网站模板怎么用怎么套模板 网站
  • 建设二手商品网站总结石景山安保服务公司电话
  • 网站建设对于企业的重要性龙岗企业网站设计公司
  • 网站搭建在线支付数码产品网站模板