当前位置: 首页 > news >正文

网站空间管理面板制作一个app软件需要多少时间

网站空间管理面板,制作一个app软件需要多少时间,游戏网站排行榜前十名,logo设计免费在线生成数据分析与可视化 为了拟合出更好的结果就要了解训练数据之间的相互关系#xff0c;进行数据分析是必不可少的一步 导入必要的库 # 导入库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns pandas库是一个强大的分析结构化…数据分析与可视化 为了拟合出更好的结果就要了解训练数据之间的相互关系进行数据分析是必不可少的一步 导入必要的库 # 导入库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns pandas库是一个强大的分析结构化数据的python库是Pythonopen in new window的核心数据分析支持库提供了快速、灵活、明确的数据结构旨在简单、直观地处理关系型、标记型数据。 numpy是python中科学计算的基础库提供多维数组对象各种派生对象如掩码数组和矩阵以及用于数组快速操作的各种API有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数基本统计运算和随机模拟等等。 可视化的图标能便于分析数据 matplotlib是一个python 2D绘图库它以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形。 seaborn 是一个基于matplotlib进行进行二次封装的绘图库它也绘制更为集成、复杂的图表。 绘制数据热力图 # 相关性热力图 sns.heatmap(train_data.corr().abs(), cmapYlOrRd) 上面是教程给的代码下面是自己尝试调整了一部分参数后的 # 相关性热力图 fig, ax plt.subplots(figsize(18,18))#设置画布大小 sns.heatmap(train_data.corr(),squareTrue, annotTrue, vmax1, vmin0,annot_kws{size: 5},linewidths0.3, # 控制每个小方格之间的间距linecolorwhite, # 控制分割线的颜色cmapRdBu_r) 绘制直方图 # x7分组下标签均值 sns.barplot(xx7, ytarget, datatrain_data) 模型交叉验证 交叉验证Cross-Validation是机器学习中常用的一种模型评估方法用于评估模型的性能和泛化能力。 简单来说就是通过数据评估不同模型避免过拟合或欠拟合从而可以找到性能最优的模型。 上面的代码验证评估了四个模型通过输出结果其实不难发现树模型的macro F1效果好 一般的随机森林RandomForestClassifier效果比决策树DecisionTreeClassifier好一些本题经过一定特征工程后亦是如此。 特征工程 通过进行特征工程我们可以优化训练数据使得得到的模型的性能提升 教程给了如上的特征处理经过训练发现common_ts_day与x1_meanx2_mean是其中对提升精度影响比较大的特征 数据清洗 -- 缺失值与异常值处理 训练模型时遇到报错ValueErrorInput contains NaN, infinity or a value too large for dtype(float64). 处理异常值以训练集 train_data 为例 1.检查特征类型 print(train_data.dtypes()) #打印训练集特征类型 2.针对不符合类型训练时抛弃 train_data.drop([udmap, common_ts, uuid #训练时 3.无穷值处理 #检查是否有无穷数据 print(np.isfinite(train_data).all()) #或 print(np.isinf(train_data).all())#处理 train_inf np.isinf(train_data) #提取 train_data[train_inf] 0 #替换 在使用 dropna 时遇到删除带有缺失值行数据失败的情况 这里是因为 NaN 是一个空字符串, 但 dropna 并不会将空字符串当作缺失值处理 所以没能成功删除 同时因为删除带有缺失值的行会改变行数处理测试集 test_data 后会导致提交平台检测出错误 所以采用填充处理 最简单的是用 0 填充 train_data.fillna(0) #将 NaN 替换成 0 也可以使用 replace train_data.replace(0,np.nan,inplaceTrue) #将缺失值替换成 0 #如果在其他项目中这里也可以替换成 nan 然后使用 dropna 缺失值填补有很多方法 1.人工填补 2.平均数填补 3.众数填补 4.中位数填补 5.临近数填补 等等等等还可以采用一些算法进行填补 1.独热编码One-HotEncoding 可以扩充特征采用N位状态寄存器来对N个可能的取值进行编码每个状态都由独立的寄存器来表示 baseline 中的函数 udmap_onethot # 定义函数 udmap_onethot用于将 udmap 列进行 One-Hot 编码 def udmap_onethot(d):v np.zeros(9) # 创建一个长度为 9 的零数组if d unknown: # 如果 udmap 的值是 unknownreturn v # 返回零数组d eval(d) # 将 udmap 的值解析为一个字典for i in range(1, 10): # 遍历 key1 到 key9, 注意, 这里不包括10本身if key str(i) in d: # 如果当前键存在于字典中v[i-1] d[key str(i)] # 将字典中的值存储在对应的索引位置上return v # 返回 One-Hot 编码后的数组 对星期进行 One-Hot 编码 # 定义函数 week_onethot用于将 common_ts_week 列进行 One-Hot 编码 def week_onethot(d):v np.zeros(7)if d Sunday:v[0] 1elif d Monday:v[1] 1elif d Tuesday:v[2] 1elif d Wednesday:v[3] 1elif d Thursday:v[4] 1elif d Friday:v[5] 1elif d Saturday:v[6] 1return v 2.特征二元化 将数值型的属性转换为布尔值的属性设定一个阈值或条件划分属性值为0或1 简单来说就是将特征分成两部分用 1 / 0 区分是否满足某条件 baseline 中的 udmap_isunknown # 编码 udmap 是否为空 train_data[udmap_isunknown] (train_data[udmap] unknown).astype(int) test_data[udmap_isunknown] (test_data[udmap] unknown).astype(int) 判断 x7 是否为 1 # 特征 x7 是否为 1 train_data[x7_is1] train_data[x7].apply(lambda d : d 1) test_data[x7_is1] test_data[x7].apply(lambda d : d 1)
http://www.w-s-a.com/news/338225/

相关文章:

  • 人才网站app建设建议系统开发生命周期法的优点表现
  • 门户网站想要微信登录怎么做湖南网站seo推广
  • 襄阳 网站建设管理系统网站
  • 重庆工程建设招标投标交易信息网广州外贸seo优化
  • 一个一起做网站东莞设计兼职网站建设
  • 杭州网站程序开发公司在哪个公司建设网站好
  • 网店的网站设计方案济南手机建站价格
  • 网站做了301重定向域名会自动跳转吗唐山地方志网站建设
  • 学校网站建设说明书海南省建设执业资格注册管理中心网站
  • 东莞哪家网站建设好网站风格设定
  • 自驾游网站模板搭建wordpress步骤
  • wordpress视频网站上传视频提升学历是什么意思
  • 江西省城乡建设厅建设网站浙江建设
  • 网站联系我们页面临平做网站
  • 如何用网站做cpa交互比较好的网站
  • 一家只做特卖的网站wordpress修改模板教程
  • 与恶魔做交易的网站成都到西安高铁票价
  • 太原网站制作哪家便宜长春昆仑建设股份有限公司网站
  • 优质做网站价格设计手机商城网站建设
  • 高校网站建设制度无锡网站建设排名
  • 做网站的软件wd的叫啥无锡公司网站建设服务
  • 网站建设一般需要多久网站服务器基本要素有哪些
  • 大连开发区网站开发公司免费网站建设哪个好?
  • 关于建设门户网站的通知海曙区建设局网站
  • 韩国建设部网站温州企业网站制作
  • 苏州网站建设优化贵州网站建设lonwone
  • 网站建设与推广方案模板网站建设教程搭建浊贝湖南岚鸿给力
  • 网站建设内部下单流程图昆明网站制作公司
  • 手机网站焦点图在线外链推广
  • 做静态页面的网站中国建设银行河南省分行网站