当前位置: 首页 > news >正文

福州网站开发cms成都便宜做网站的

福州网站开发cms,成都便宜做网站的,介绍自己做的网站,wordpress更改文件夹文章目录 前言Z-Score标准化Z-Score应用示例 Min-Max归一化Min-Max应用示例 总结 前言 第五天是我们的numpy学习计划中的最后一天。 在数据处理和数据分析中#xff0c;数据预处理是非常重要的一步。我们不可能完全靠肉眼来分析数据#xff0c;总会有用到各种算法模型的时候… 文章目录 前言Z-Score标准化Z-Score应用示例 Min-Max归一化Min-Max应用示例 总结 前言 第五天是我们的numpy学习计划中的最后一天。 在数据处理和数据分析中数据预处理是非常重要的一步。我们不可能完全靠肉眼来分析数据总会有用到各种算法模型的时候例如使用聚类、回归分析。 如果原来的数据非常“肮脏”不规整我们将会得到一个不可靠的糟糕结果此时我们需要用两种十分常用的数据预处理手段来清洗我们的数据。 今天仅仅包括如下两个内容 Z-Score标准化Min-Max归一化 Z-Score标准化 Z-Score标准化是一种常见的数据标准化方法它通过对原始数据进行均值和标准差的线性变换将数据变换为均值为0、标准差为1的分布。 Z-Score标准化后的数据通常在机器学习模型上表现更好并且我们可以根据Z-Score标准化后的数据来去除异常值。 具体的标准化公式如下 X standardized X − X ˉ σ X_{\text{standardized}} \frac{{X - \bar{X}}}{{\sigma}} Xstandardized​σX−Xˉ​ 其中 X s t a n d a r d i z e d X_{standardized} Xstandardized​表示标准化后的数据 X X X表示原始数据 X m e a n X_{mean} Xmean​表示原始数据的均值 X s t d X_{std} Xstd​表示原始数据的标准差。 关于Z分数Z-Score 其实Z-Score标准化就是数据计算成对应的Z分数我们可以利用Z分数进行异常值处理如果Z分数大于某一个阈值(通常 ± 2)则认为它是异常值进行丢弃。 使用Z分数处理异常值需要满足正态分布的假设。Z分数越大就代表它越接近正态分布的右侧Z分数越小就代表它越接近正态分布的左侧对于那些及其右侧或者及其左侧的数据因为很可能是错误的数据所以视为异常值。 Z X − X ˉ σ Z \frac{{X - \bar{X}}}{{\sigma}} ZσX−Xˉ​ 下面是使用Numpy实现Z-Score标准化的代码示例 import numpy as npdef z_score(X):X_mean np.mean(X)X_std np.std(X)X_standardized (X - X_mean) / X_stdreturn X_standardized Z-Score应用示例 在运行过上面的Z-Score标准化的实现代码后我们可以运行下面的代码。 假设我们现在有一批大学生的身高数据 我们知道正常成年人的身高一般都是在[150, 190]之间而我们在下面的数据中添加了一个身高为300的异常数据 让我们来看看它的Z分数是多少并找出300这个异常身高。 # 身高数据 arr np.array([160, 170, 180, 165, 155, 163, 183, 188, 300])# 计算arr中的元素的z分数 std_data z_score(arr)# np.abs()可以计算绝对值 abs_zc np.abs(std_data)print(原数据) print(arr) print()print(Z分数的绝对值) print(abs_zc) print()# 大于号“”也是一个运算符运算结果是True和False compare abs_zc 2 print(比较结果) print(compare) print()# compare和arr的形状相同区别是arr里面的是真正的数据compare对应每个元素的比较结果 # 只有对应在compare里面为True的元素会被筛选出来 outlier arr[compare]print(异常值) print(outlier) 输出结果 从下面的输出结果中我们可以看到正常的身高的Z分数的绝对值都位于[0, 1]之间而身高为300的那个异常数据的Z分数为2.73893945显然这已经远远大于了2这个阈值这个阈值的设定并没有严格限定我只能告诉你阈值的绝对值越高去除的数据越少反之越多这对应了正态分布的左右两端都只有少量数据的特点通过设定Z分数的阈值我们只保留正态分布中间的那些常见数据我们应该将它视为异常值去除。 原数据 [160 170 180 165 155 163 183 188 300]Z分数的绝对值 [0.59220312 0.35426437 0.11632561 0.47323375 0.7111725 0.52082150.04494399 0.07402539 2.73893945]比较结果 [False False False False False False False False True]异常值 [300] Min-Max归一化 Min-Max归一化是一种线性变换方法将数据缩放到指定的范围内。它通过对原始数据进行线性变换将数据映射到[0, 1]的范围内。 有时候原始数据的尺度相差太大不满足我们的算法模型的假设假设不同数据的尺度都是一致的可能会让我们得到了错误的结果此时我们就应该使用Min-Max归一化将数据归一化到[0, 1]之间。 具体的归一化公式如下 X normalized X − X min X max − X min X_{\text{normalized}} \frac{{X - X_{\text{min}}}}{{X_{\text{max}} - X_{\text{min}}}} Xnormalized​Xmax​−Xmin​X−Xmin​​ 其中 X n o r m a l i z e d X_{normalized} Xnormalized​表示归一化后的数据 X X X表示原始数据 X m i n X_{min} Xmin​表示原始数据的最小值 X m a x X_{max} Xmax​表示原始数据的最大值。 下面是使用Numpy实现Min-Max归一化的代码示例 import numpy as npdef min_max(X):X_min np.min(X)X_max np.max(X)X_normalized (X - X_min) / (X_max - X_min)return X_normalized关于Min-Max其它小内容 其实不一定是归一化到[0, 1]这个区间中有些特殊情况会需要归一化到[-1, 1]或者别的区间但是大部分时候都是[0, 1]区间。 Min-Max应用示例 在运行过上面的Min-Max归一化的实现代码后我们可以运行下面的代码。 假设我们现在有两批医学数据 大尺度的是患者平均的每日步数小尺度的是患者的体脂百分比。 这两批数据的尺度非常巨大如果算法模型更偏向大数值的数据那么毫无疑问会偏向患者的平均每日步数这一边这并不是我们想要的结果因此我们需要进行Min-Max归一化。 具体看下面的代码 # 创建两列尺度差距很大的数据 col1 np.array([55000, 45000, 35000, 25000, 15000]) # 较大数值的数据列 col2 np.array([15, 25, 35, 45, 55]) # 较小数值的数据列# 分别应用Min-Max规约 normalized_col1 min_max(col1) normalized_col2 min_max(col2)# 输出原始数据和归一化后的数据 print(原始数据 - 较大数值的列:) print(col1) # \n 代表换行符仅仅写print()的时候输出的就是\n这个换行符 print(\n归一化后 - 较大数值的列:) print(normalized_col1)print(\n原始数据 - 较小数值的列:) print(col2) print(\n归一化后 - 较小数值的列:) print(normalized_col2)总结 本文介绍了使用Numpy实现Min-Max归一化和Z-Score标准化算法的方法。归一化和标准化是数据预处理中常用的技术能够有效地提高数据的可处理性和模型的性能。在实际应用中根据具体的数据情况选择合适的预处理方法是非常重要的。希望本文能对读者在使用Numpy进行数据预处理时有所帮助。
http://www.w-s-a.com/news/169956/

相关文章:

  • 免费手机网站申请上海网站建设设计公司哪家好
  • 站长工具大全企业网上书店网站建设设计
  • 做网站的专业公司公司网站是做的谷歌的
  • 做网站前期工作wordpress图片并排
  • 免费注册网站哪个好wordpress评论修改
  • 合肥模板网站建设软件赤峰公司网站建设
  • 毕业设计都是做网站吗深圳网站制作企业邮箱
  • 网站排名 优帮云小规模公司简介怎么写
  • 那个做头像的网站好选择手机网站建设
  • 设计一个网站花多少时间做视频网站适合用什么服务器
  • asp网站开发环境订单系统单页面网站怎么做
  • 山东网站建设都有那些企业推广策略
  • 网站开发文档是什么概念衣服销售网站建设规划书范文
  • 中国建筑装饰网官网企业网站设计优化公司
  • 南海建设工程交易中心网站c2c交易平台有哪些?
  • 有没有专业做网站架构图的软件番禺建设网站哪个好
  • 建立网站第一步整站seo优化公司
  • php网站开发文章管理系统wordpress 评论 顶踩 心 插件
  • 网站做百度收录的意义html网页设计代码作业代码
  • 网站推广怎么做 知乎衡水做网站开发的
  • 重庆忠县网站建设报价网页构建
  • 怎么自己做单页网站怎么在阿里做网站
  • 公司网站重新备案做电商没几个能赚钱的
  • 网站开发我们都能解决怎样做网站吸引客户
  • 网站首页图片切换代码wordpress minfy
  • 什么程序做网站收录好企业搭建网站的必要性
  • 建设网站主题建站必须要域名吗
  • 网站建设海报设计购物平台网站建设框架
  • 湖北在线网站建设建一个网站迈年
  • 上班自己花钱做的网站网站首页的动态怎么做