当前位置: 首页 > news >正文

网站备案 注册用户网站开发代码编辑器

网站备案 注册用户,网站开发代码编辑器,wordpress做旅游网站,网站可行性分析基于PCA与LDA的数据降维实践 描述 数据降维#xff08;Dimension Reduction#xff09;是降低数据冗余、消除噪音数据的干扰、提取有效特征、提升模型的效率和准确性的有效途径#xff0c; PCA#xff08;主成分分析#xff09;和LDA#xff08;线性判别分析#xff0…基于PCA与LDA的数据降维实践 描述 数据降维Dimension Reduction是降低数据冗余、消除噪音数据的干扰、提取有效特征、提升模型的效率和准确性的有效途径 PCA主成分分析和LDA线性判别分析是机器学习和数据分析中两种常用的经典降维算法。 本任务通过两个降维案例熟悉PCA和LDA降维的原理、区别及调用方法。 源码下载 环境 操作系统Windows 10、Ubuntu18.04 工具软件Anaconda3 2019、Python3.7 硬件环境无特殊要求 依赖库列表 matplotlib 3.3.4 scikit-learn 0.24.2分析 任务1、基于PCA算法实现鸢尾花数据集降维涉及下列三个环节 A加载鸢尾花Iris数据并进行降维 B降维后的数据可视化 C使用K-NN算法进行分类对比降维前后的分类准确性 任务2、基于LDA算法实现红酒数据集降维涉及以下四个环节 A加载红酒数据集 B使用PCA和LDA两种算法对数据进行降维 C降维结果可视化 D降维前后的分类准确性对比 实施 1、基于PCA算法实现鸢尾花数据集降维 鸢尾花数据原有四个特征维度运用PCA算法将特征维度降为两个之后进行可视化并运用K-NN算法进行分类对比降维前后的分类准确性数据降维的目的之一是提升模型的准确性。 1.1 加载鸢尾花特征数据并使用PCA算法降维 import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.datasets import load_iris from sklearn.neighbors import KNeighborsClassifier# 加载鸢尾花数据集 iris load_iris() data iris.data # 特征数据 target iris.target # 标签数据 print(data.shape) # 查看数据维度150, 4# PCA降维 pca PCA(n_components 2).fit(data) # 利用PCA算法降成2维 new_data pca.transform(data) print(new_data.shape) # 查看数据维度1502结果如下 (150, 4) (150, 2)可以看到鸢尾花数据由四维四个特征降为两维度。 1.2 数据可视化并使用K-NN算法对比降维前后的分类准确性 # 降维后的数据集可视化 plt.title(Iris dimensions reduction: 4 to 2) plt.scatter(new_data[:, 0], new_data[:, 1], ctarget) plt.show()# 使用KNN算法对比降维前后分类的准确性 model KNeighborsClassifier(3) score model.fit(data, target).score(data, target) print(4-dims:, score) score model.fit(new_data, target).score(new_data, target) print(2-dims:, score)输出结果 结果分析 数据从4维降到2维后可以很方便地进行可视化。从散点图中直观地看降维后的数据较好地保留了原数据的分布信息。另外可以看到降维后的KNN分类模型准确性有所提升这也是数据降维的目的之一。 2、基于LDA算法实现红酒数据集降维 红酒数据集Wine有13个特征即13个维度我们分别使用PCA和LDA算法对数据集进行降维降成2维之后使用逻辑回归LogisticRegression分别在LDA算法降维前后的数据集上建立分类模型对比同一种模型在数据集降维前后的准确性直观感受数据降维对模型准确性的影响。 2.1 加载红酒数据集 import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.discriminant_analysis import LinearDiscriminantAnalysis from sklearn.datasets import load_wine# 加载红酒数据集 wine load_wine() data wine.data target wine.target print(data.shape) # 查看数据维度2.2 分别使用LDA和PCA算法进行降维 # PCA降维无类别 pca PCA(n_components 2).fit(data) # 利用PCA算法降成2维 data_pca pca.transform(data) # 降维转换 print(PCA:, data_pca.shape) # 查看数据维度# LDA降维有类别考虑样本标签 lda LinearDiscriminantAnalysis(n_components2).fit(data, target) data_lda lda.transform(data) print(LDA:, data_lda.shape)结果如下 (178, 13) PCA: (178, 2) LDA: (178, 2)可以看到两种算法都将红酒数据集由13维降成2维。 2.3 降维结果可视化 数据降到2维后可以很方便地用散点图进行可视化下面分别将两种算法降维后的红酒数据集进行可视化对比其分布情况。 # LDA算法更适合有标签数据的降维 # 下面将两种方法降维后的数据进行可视化 fig plt.figure(figsize(12, 4)) # 生成画板# PCA降维结果 ax1 fig.add_subplot(1, 2, 1) # 添加子图1 ax1.set_title(PCA) ax1.scatter(data_pca[:, 0], data_pca[:, 1], ctarget)# LDA降维结果 ax2 fig.add_subplot(1, 2, 2) # 添加子图2 ax2.set_title(LDA) ax2.scatter(data_lda[:, 0], data_lda[:, 1], ctarget)plt.show() # 显示图像显示结果 可以看到LDA降维因为考虑到了样本的类别标签信息降维后的数据分布能够较好地将类型分开。 2.4 LDA降维前后的分类准确性对比 使用逻辑回归算法对LDA降维前后的数据集建立分类模型对比其准确性。 from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression# 1、使用逻辑回归模型在降维前的数据集上训练并评估 X_train, X_test, y_train, y_test train_test_split(data, target, random_state0)model LogisticRegression().fit(X_train, y_train) score model.score(X_test, y_test) # 在测试集上评估分类准确性 print(score)# 2、在LDA降维后的数据集上训练并评估 X_train, X_test, y_train, y_test train_test_split(data_lda, target, random_state0) model LogisticRegression().fit(X_train, y_train) score model.score(X_test, y_test) # 在测试集上评估分类准确性 print(score)结果如下 0.9333333333333333 1.0可以看到使用LDA降维后的数据建模分类准确性有所提升。
http://www.w-s-a.com/news/593417/

相关文章:

  • 莱州网站建设方案北京装修公司口碑
  • 大型网站建设济南兴田德润团队怎么样韩国女足出线了吗
  • 南通做网站找谁重庆网络推广网站推广
  • ps网站主页按钮怎么做怎样做网站的用户分析
  • 哪个网站做黑色星期五订酒店活动公司网络营销推广软件
  • 岳阳新网网站建设有限公司网页设计基础考试题目
  • 辽宁响应式网站费用海外平台有哪些
  • 杨凌规划建设局网站网站后台建设怎么进入
  • 有赞商城网站建设企业管理咨询是做什么的
  • 提供衡水网站建设中国石化工程建设有限公司邮政编码
  • 大芬地铁站附近做网站工业设计公司报价
  • 建设网站最强永年网站建设
  • 网站分站代理加盟wordpress国内工作室主题
  • 东营远见网站建设公司服装网站建设内容
  • 互助平台网站建设费用百度seo优化怎么做
  • lol英雄介绍网站模板工商局网上注册
  • 电商网站运营策划什么样的网站容易做seo
  • 网站备案需要什么流程怎么创建小程序卖东西
  • 陇西网站建设 室内设计持啊传媒企业推广
  • 连云港做网站制作首选公司如何让单位网站做防护
  • wordpress企业网站源码开发网站用什么工具做设计
  • 网站负责人不是法人seo神马网站推广器
  • 网站建设绩效考核方案wordpress支付宝付款
  • 高要区住房和城乡建设局网站如何网上注销自己的公司
  • 哪种技术做网站容易论文答辩图片做记录片的是哪个网站
  • 怎样在微信中做网站网站的备案号在哪
  • 返利淘网站怎么做wordpress htnl短代码
  • 网站 手机 appwordpress管理账户
  • 徐州网站建设 网站制作做招商网站的前景怎么样
  • 网站开发就业岗位鹧鸪哨网站1v1深度开发