当前位置: 首页 > news >正文

岳阳网站建设企业可以搜索任何网站的浏览器

岳阳网站建设企业,可以搜索任何网站的浏览器,wordpress 多说头像,做六个网站静态页多少钱方法有以下这些 首先看数据有没有重复值、缺失值情况 离散#xff1a;独热 连续变量#xff1a;离散化#xff08;也成为分箱#xff09; 作用#xff1a;1.消除异常值影响 2.引入非线性因素#xff0c;提升模型表现能力 3.缺点是会损失一些信息 怎么分#xff1a;…方法有以下这些 首先看数据有没有重复值、缺失值情况 离散独热 连续变量离散化也成为分箱 作用1.消除异常值影响 2.引入非线性因素提升模型表现能力 3.缺点是会损失一些信息 怎么分 1.根据业务指标分比如10000是高收入人群 2.固定方法等宽、等频、聚类、有监督等宽就是没类数值区间长度一样 等频就是每个里面样本个数一致 一个矛盾点等宽会受异常值影响等频则完全忽略异常值影响要兼顾则用聚类分箱公认效果好因为它会把异常值单独分成一类 特征衍生 1.分组统计法即a特征根据b特征的不同取值求统计值注意b特征得是离散的且取值要多些。离散变量不要只用离散统计值。统计值结果可以和变量再做四则运算衍生 2.时序特征 先处理成datetime格式然后用函数提取 a.提取其年月日为特征 b.季度特征是否在周末等周几 c.和关键时间点的差值 为什么有用同一组内的用户表现出类似的特效方便预测 如何做衍生考虑自然周期和业务周期 特征筛选 1.方差分析法 step1:提出两个相反的假设两个群体的xx指标是否有差异 step2:判断两个群体是否分部一致转换为和整体分布是否一致看统计量是否一致 step3:设计统计量算出ssb和sse然后用F检验 step4:计算F后查表看是否接受 注意方差分析只是用到了F检验。方差分析能够同时检验多个样本而t检验只能检验两个样本 2.RFE方法递归消除法 计算特征重要度每次删除最低的几个循环计算 存在的问题模型会过拟合且输出结果随机 解决方法用一个已经训练好的模型去筛选在全量样本上先训练一个每轮筛选都训练一个新的效果也会提升 注意方差分析等一般用于指标初筛RFE用于精筛 进一步优化交叉验证 缺失值处理 首先要当心有些0就是缺失值不一定是none或者np.nan 具体思路图如上 为什么要处理缺失值 1.异常值可能有额外信息 2.有些算法不会自动填补缺失值有些算法在sklearn里面不能填补 一.分层均值先聚类再按层的均值填补 热平台法以点估点用其他有值的类似点估计这个点分为最近邻用聚类求、序贯计算相关性后看、随机 二.模型法KNN、决策树、随机森林、SVM把缺失列作为目标列没有缺失的作为训练集缺失的作为测试集 当有多列都有缺失值时如何处理 整体思路 三.多重插补 目前效果最好的是miceforest法比如有三列有缺失值先都随机填然后用完整的bc列预测a列再用ab列预测c不断循环直到值不太变 以上讲了三种方法那么如何选择呢 这里的效率指运算效率
http://www.w-s-a.com/news/197901/

相关文章:

  • 做一个网站的详细教学wordpress 忘记用户名密码
  • 建设银行的网站是多少wordpress添加新页面跳转
  • 网站设计费用抓取网站访客qq号码
  • 驾校视频网站模板郑州网站建设价格
  • 上海 有哪些做网站的公司成都企业网站备案流程
  • 移动端快速建站的方法青海公司网站建设
  • 网站重新搭建程序要多少钱移动互联网应用的使用情况
  • 学建站论坛给别人做网站怎么赚钱吗
  • 响应式网站代码校友会网站建设的目的
  • 北京公司网站网站建设html模板
  • 专门做医疗器械的网站免费网页制作系统团队
  • 网站开发技术 html临夏网站建设
  • flash网站模板免费下载拍卖网站开发多少钱
  • 北京网站建设制作颍州网站建设
  • 网站制作报价表做网站上海公司
  • 简洁大气蓝色文章资讯网站百度搜索广告推广
  • 河南建设工程协会网站网站收银系统建设
  • 网站制作 服务企业网站案例展示
  • 咸宁网站建设wordpress手动降级
  • 昆明做网站建设怎么样做网站赚钱全攻略
  • 企业网站建设实战教程微信如何注册小程序
  • 做一件代发网站百度seo服务
  • 小说网站开发 公司可以做行程的网站
  • 古交市网站建设公司apk连接wordpress
  • 网页 网 址网站区别wordpress菜单居右
  • 网站建设搭建运营一台云服务器做多个网站
  • 用php做网站用什么框架推广网站推荐
  • 如何用二级域名做网站多用户网上商城
  • 河南省建设科技网站浅谈电子商务网站建设与规划
  • 网站空间需要续费青海网站建设推广