当前位置: 首页 > news >正文

矿产网站建设价格成都企业模版网站建设

矿产网站建设价格,成都企业模版网站建设,做网站建设业务,广东东信润建设有限公司网站目录 一、前言 二、正文 Ⅰ.主成分分析 Ⅱ.核主成分分析 三、结语 一、前言 前面介绍的特征选择方法获得的特征#xff0c;是从原始数据中抽取出来的#xff0c;并没有对数据进行变换。而特征提取和降维#xff0c;则是对原始数据的特征进行相应的数据变换#xff0c;并…目录 一、前言 二、正文 Ⅰ.主成分分析 Ⅱ.核主成分分析 三、结语 一、前言 前面介绍的特征选择方法获得的特征是从原始数据中抽取出来的并没有对数据进行变换。而特征提取和降维则是对原始数据的特征进行相应的数据变换并且通常会选择比原始特征数量少的特征同时达到数据降维的目的。常用的数据特征提取和降维的方法有主成分分析,核成分分析流行学习t-SNE,多维尺度分析等方法。 二、正文 from sklearn.decomposition import PCA,KernelPCA from sklearn.manifold import Isomap,MDS,TSNE from sklearn.preprocessing import StandardScaler from sklearn.datasets import load_wine wine_x,wine_yload_wine(return_X_yTrue) wine_xStandardScaler().fit_transform(wine_x)在介绍特征提取和降维的方法之前我们先导包读取相应的数据。 通过标准化进行数据特征变换的处理。 Ⅰ.主成分分析 pcaPCA(n_components13,random_state123) pca.fit(wine_x) exvarpca.explained_variance_ plt.figure(figsize(10,6)) plt.plot(exvar,r-o) plt.hlines(y1,xmin0,xmax12) plt.xlabel(number) plt.ylabel(PCA) plt.show() 主成分分析法Principal Component Analysis,PCA是采用一种数学降维的方法在损失很少信息的前提下找出几个综合变量为主成分来代替原来众多的变量使这些主成分尽可能地代表原始数据的信息其中每个主成分都是原始变量的线性组合而且各个主成分之间不相关即线性无关。通过主成分分析我们可以从事物错综复杂的关系中找到一些主要成分通常选择累积 贡献率≥85%的前m个主成分从而能够有效利用大量统计信息进行定性分析揭示变量之间的内在关系得要一些事物特征及其发展规律的深层次信息和启发推动研究进一步深入。通常使用主成分个数远小于原始特征个数使用起到特征提取和降维的目的。  从结果分析使用数据的前三个主成分即可对其进行良好的数据建模。 pca_wine_xpca.transform(wine_x)[:,0:3] print(pca_wine_x.shape) #输出结果 1783如上我们可以知道前三个主成分可对其数据建模于是我们pca进行数据变换之后对其进行切片前三列的数据。  colors[red,blue,green] shape[o,s,*] figplt.figure(figsize(10,6)) ax1fig.add_subplot(111,projection3d) for ii,y in enumerate(wine_y):ax1.scatter(pca_wine_x[ii,0],pca_wine_x[ii,1],pca_wine_x[ii,2],s40,ccolors[y],markershape[y])ax1.set_xlabel(pca1,rotation20) ax1.set_ylabel(pca2,rotation20) ax1.set_zlabel(pca3,rotation20) ax1.azim225 ax1.set_title(pca) plt.show() 先将三种成分分别的颜色和标记封装在列表当中然后设置窗口 111是设置位置即第一行第一列的第一个格子则会也就意味着这里只有一个图projection映射参数设置为3d然后将前三个主成分通过循环在三维空间画出其数据分布。 这样我们就能区分出三个主成分的数据分布情况即不同类别的分布情况。  Ⅱ.核主成分分析 PCA是线性的数据降维技术而核主成分分析则是针对非线性的数据表示对其进行特征提取并数据降维。 kpcaKernelPCA(n_components13,kernelrbf,gamma0.2,random_state123) kpca.fit(wine_x) eigenvalueskpca.eigenvalues_ plt.figure(figsize(10,6)) plt.plot(eigenvalues,r-o) plt.hlines(y4,xmin0,xmax12) plt.xlabel(number) plt.ylabel(KernelPCA) plt.show() 方法与主成分分析大差不大但是这里注意一个KernelPCA类中的一个属性 eigenvalues_Eigenvalues of the centered kernel matrix in decreasing order. If n_components and remove_zero_eig are not set, then all values are stored. 翻译过来就是:中心核向量的特征值按照降序排序如果未设置n_components和remove_zero_eig则存储所有值。 原本这个属性叫做lambdas_但是被更改为eigenvalues_特征值。 同样针对前三个核主成分可以在三维空间将数据分布进行可视化。 kpca_wine_xkpca.transform(wine_x)[:,0:3] print(kpca_wine_x.shape) colors[red,blue,green] shape[o,s,*] figplt.figure(figsize(10,6)) ax1fig.add_subplot(111,projection3d) for ii,y in enumerate(wine_y):ax1.scatter(kpca_wine_x[ii,0],kpca_wine_x[ii,1],kpca_wine_x[ii,2],s40,ccolors[y],markershape[y])ax1.set_xlabel(kpca1,rotation20) ax1.set_ylabel(kpca2,rotation20) ax1.set_zlabel(kpca3,rotation20) ax1.azim225 ax1.set_title(kpca) plt.show() 做法跟主成分大差不差利用散点在空间中的分布来发现其中的数据分布情况。 可以看出核主成分分析与主成分分析之间的主成分核成分之间的数据分布情况大有不同。 三、结语 上篇我们先从线性与非线性入手希望能对你提供帮助点赞收藏以备不时之需关注我有关新的数据分析的文章第一时间告知于你
http://www.w-s-a.com/news/260678/

相关文章:

  • php电子商务网站开发沂源手机网站建设公司
  • html和php做网站哪个好3gcms企业手机网站整站源码asp
  • 网站建设网页设计案例云南建设厅网站删除
  • 杏坛网站制作太原做网站要多少钱呢
  • 做新闻类网站还有市场吗东莞黄页网广告
  • 地方网站做外卖专业做互联网招聘的网站有哪些
  • 网站推广公司兴田德润紧急网页升级紧急通知
  • 厦门做网站哪家强企业网站网页设计的步骤
  • 普拓网站建设济南行业网站建设
  • 燕郊 网站开发网站里的地图定位怎么做
  • 门户网站建设招标互联网创业项目概述
  • 用什么做网站比较好市场调研公司是做什么的
  • 电商网站充值消费系统绍兴网站优化
  • 深圳网站建设公司联虚拟币交易网站开发
  • 专业网站设计建设公司抖音代运营公司排名前十强
  • 做网站架构肃北蒙古族自治县建设局网站
  • 推广网站怎么建经济研究院网站建设方案
  • 网站建设商家淘宝客自建网站做还是用微信qq做
  • django做网站效率高吗涉县移动网站建设报价
  • 做外贸网站注册什么邮箱能够做渗透的网站
  • 购物网站 怎么做织梦网站会员功能
  • 北京市网站开发公司郑州联通网站备案
  • 温岭专业营销型网站建设地址wordpress小程序怎么不用认证审核
  • 网站建设主体设计要求微信公众号缴费
  • 网站建设的税率WordPress多用户建站
  • 专业门户网站的规划与建设网络培训
  • 东莞汽车总站停止营业crm管理系统在线使用
  • 深圳网站建设公司哪个网络优化是做什么的
  • 大连地区做网站自己怎么做电影网站
  • 成都APP,微网站开发手机要访问国外网站如何做