当前位置: 首页 > news >正文

沈阳酒店企业网站制作公司竞价网站怎么做seo

沈阳酒店企业网站制作公司,竞价网站怎么做seo,阿里云做的网站,基于js原生的新闻类静态网站建设评估数据 结构方面 需要清理#xff1a;乱数据不需要清理#xff1a;整洁数据 每列是一个变量每行是一个观察值每个单元格是一个值 内容方面 需要清理#xff1a;脏数据 丢失数据重复数据不一致数据无效或错误数据 不需要清理#xff1a;干净数据 # 获取整体信息 df.in…评估数据 结构方面 需要清理乱数据不需要清理整洁数据 每列是一个变量每行是一个观察值每个单元格是一个值 内容方面 需要清理脏数据 丢失数据重复数据不一致数据无效或错误数据 不需要清理干净数据 # 获取整体信息 df.info() # 获取开头/结尾/随机数据来评估 df.head(10) df.tail(10) df.sample(10) # 调整展示上限 pd.set_option(display.max_columns, 150) pd.set_option(display.max_colwidth, 500)# 评估丢失数据 # 返回布尔值组成的Series或DataFrame scores[考试2].isnull() df.isnull() # 获取空缺值数量 scores[考试2].isnull().sum() df.isnull().sum() # 提取丢失数据的行 scores[scores[考试2].isnull()]# 评估重复数据 students[学号].duplicated() students.duplicated(subset[学号,性别])# 评估不一致数据 students[班级].value_counts()# 评估无效/错误数据 # 排序 students[身高].sort_values() students.describe()清洗数据 结构方面更改为整洁数据结构 内容方面 丢失数据 人工填入缺失值不处理缺失值把有缺失值的行删除用例如平均数等填充代替缺失值 重复数据删除不一致数据统一无效数据删除或替换数据类型转换 实际操作 # 重命名索引和列名(原变量不变需要重新赋值或可选参数inplaceTrue df1.rename(index{2_:2, _5:5, 6*:6}) df1.rename(columns{2_:2, _5:5, 6*:6}) df2.rename(index某函数/方法 df2.rename(columnsstr.upper # 大写 # 更多Series相关方法https://pandas.pydata.org/docs/reference/api/pandas.Series.html # 更多DataFrame相关方法https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html# 重设索引 # 将列值作为索引 df3.set_index(Salesperson) # 还原 df3.reset_index()# 对索引和列名重新排序(原变量不变需要重新赋值或可选参数inplaceTrue df4.sort_index()# 对数据进行转置 df1 df1.T # 对列进行拆分 df2[[人口, 面积]] df2[人口密度].str.split(/, expandTrue) df2 df2.drop(人口密度, axis1) # 把不同列合并成一列 df3[姓].str.cat(df3[名], sep-) # 把宽数据转换成长数据列名变成列值 df4 pf.melt(df4, id_vars[不变的列名], var_name列名所在列列名, value_name原列值所在列列名) # 对行进行拆分 df5.explode(课程列表) # 删除行删除列(原变量不变需要重新赋值或可选参数inplaceTrue df6.drop(2) df6.drop([列,lie],axis1)# 对整列缺失值进行填充索引定位 df1[国家] 中国 # 对某个缺失值进行填充 df2.loc[003:004, 销售额] 800 # 自动找到缺失值进行填充 df4[B].fillna(df[B].mean()) df4.fillna(0) df4.fillna({A: 0, B: 10}) # 不同列可指定替换值 # 删除存在缺失值的行(原变量不变需要重新赋值或可选参数inplaceTrue df5.dropna() df5.dropna(subset[工资]) # 控制范围 # 删除重复数据(原变量不变需要重新赋值或可选参数inplaceTrue df6[姓名].drop_duplicates() df6.drop_duplicates(subset[a,b] keeplast) #同时重复保留最后 # 对值进行替换不一致数据(原变量不变需要重新赋值或可选参数inplaceTrue df7.replace([hnu, 湖大], 湖南大学) df7.replace(hnu: 湖南大学) # 对值的类型进行转换 # 分类数据建议转换为category有利于减小内存让Pandas自动选用合适的统计方法或图表类型 s1pd.Series([1,2,3]) s1.astype(category)保存数据(覆盖原始数据 df1.to_csv(cleaned_sales_data.csv) # 读取时会将索引作为第一列需要更改列名并将其重新设置为索引# 写入时忽略索引(索引无关键信息 df1.to_csv(cleaned_sales_data2.csv indexFalse)
http://www.w-s-a.com/news/174258/

相关文章:

  • 中山企业网站多少钱学网站建设的好处
  • 做官网网站哪家公司好jianux wordpress
  • 插件素材网站新站seo优化快速上排名
  • 网站注销主体填写原因asp响应式h5网站源码下载
  • 电商类网站模板下载济南市建设网官网
  • 万户网络做网站如何采集器wordpress
  • 襄阳网站建设企业查看 wordpress 插件
  • 网站地址申请京东联盟怎么做网站
  • 三亚市城乡建设局网站网站口碑营销
  • 图书租借网站 开发企业网站搜索优化外
  • 新乡个人网站建设哪家好免费的图片做视频在线观看网站
  • 洛阳工程建设信息网站山西响应式网页建设哪里好
  • 企业网站建设市场的另一面wordpress分类插件
  • 网站建设名头公司展厅装修
  • 小型购物网站开发费用郑州企业网站模板建站
  • 个体商户建自己的网站做销售建设积分兑换官方网站
  • 网站建设与维护培训网页制作专业用语
  • 建站特别慢wordpress网页制作与设计项目策划书
  • 视频制作素材免费网站头像制作在线生成器
  • 网站建设是不是可以免费建站广州做网站 信科网络
  • 闸北区网站设计叫别人做网站后怎么更改密码
  • 为什么想做网站运营建设工程教育网站
  • 站长基地百度推广整体优化网站
  • 门窗 东莞网站建设wordpress外链论坛
  • 安徽省建设部网站官网还能用的wap网站
  • 企业网站设计开发网站关键词优化seo
  • 郑州高档网站建设台州网站建设推广
  • 广东省建设信息港网站WordPress手机缩略图设置
  • 优秀网站主题平顶山专业做网站公司
  • wordpress返回顶部插件wordpress站群seo