当前位置: 首页 > news >正文

虚拟币交易网站开发商城网站建设方案

虚拟币交易网站开发,商城网站建设方案,seo网站内容优化有哪些,网络维护公司简介这是我的第287篇原创文章。 一、引言 主成分分析#xff08;Principal Component Analysis, PCA#xff09;是一种常用的降维技术#xff0c;它通过线性变换将原始特征转换为一组线性不相关的新特征#xff0c;称为主成分#xff0c;以便更好地表达数据的方差。 在特征重要…这是我的第287篇原创文章。 一、引言 主成分分析Principal Component Analysis, PCA是一种常用的降维技术它通过线性变换将原始特征转换为一组线性不相关的新特征称为主成分以便更好地表达数据的方差。 在特征重要性分析中PCA 可以用于理解数据中最能解释方差的特征并帮助识别对目标变量影响最大的特征。可以通过查看PCA的主成分主特征向量以及各主成分所对应的特征重要性来推断哪些原始特征在新特征中起到了较大影响。 PCA 的局限性 PCA 是一种线性变换方法可能无法很好地处理非线性关系的数据。PCA 可能会丢失一些信息因为它主要关注的是数据中的方差而忽略了其他方面的信PCA 假设主成分与原始特征之间是线性关系这在某些情况下可能不成立。 二、实现过程 2.1 读取数据 # 准备数据 data pd.read_csv(rdataset.csv) df pd.DataFrame(data) print(df) # 目标变量和特征变量 target target features df.columns.drop(target) # 划分训练集和测试集 X_train, X_test, y_train, y_test train_test_split(df[features], df[target], test_size0.2, random_state0) df 2.2 对训练集做PCA主成分分析 自主选择主成分并打印出每个主成分的解释性方差 pca PCA(n_componentsmle) pca.fit(X_train) var_ratio pca.explained_variance_ratio_ for idx, val in enumerate(var_ratio, 1):print(Principle component %d: %.2f%% % (idx, val * 100)) print(total: %.2f%% % np.sum(var_ratio * 100)) 结果 共计10个主成分。 2.3 通过主成分分析原始特征重要性 打印出每个特征对于主成分的系数这反映了原始特征的重要性 print(pca.components_) 结果 通过计算10个主成分中每个原始特征的系数绝对值之和作为该特征的最终贡献度 # 计算原始特征与主成分的相关性绝对值 feature_importance  np.abs(pca.components_) # 计算每个主成分中原始特征的权重系数和 feature_importance_sum  np.sum(feature_importance, axis0) # 打印原始特征的重要性贡献度 print(\n原始特征的重要性贡献度:) ranking_df  pd.DataFrame({特征: features, 贡献度: feature_importance_sum}) ranking_df ranking_df.sort_values(by贡献度) print(ranking_df) 结果 可视化 2.4 查看累计解释方差比率与主成分个数的关系 fig, ax plt.subplots(figsize(10, 7)) ax.plot(np.arange(1, len(var_ratio) 1), np.cumsum(var_ratio), -ro) ax.set_title(Cumulative Explained Variance Ratio, fontsize15) ax.set_xlabel(number of components) ax.set_ylabel(explained variance ratio(%)) plt.show() 结果 前2个主成分累计解释性方差比率接近0.9前3个主成分累计解释方差比率超过0.95。 2.5 自动选择最优的主成分个数 设定累计解释方差比率的目标让sklearn自动选择最优的主成分个数 target 0.9 # 保留原始数据集90%的变异 res PCA(n_componentstarget).fit_transform(X_train) print(original shape: , X_train.shape) print(transformed shape: , res.shape) 结果 选择了3个主成分。 2.6 主成分选择可视化以2个主成分为例 选择两个主成分并进行可视化 pcaPCA(n_components2) #加载PCA算法设置降维后主成分数目为2 reduced_xpca.fit_transform(X_train)#对样本进行降维 principalDf pd.DataFrame(data reduced_x, columns [principal component 1, principal component 2]) print(principalDf) y_train np.array(y_train) yes_x,yes_y[],[] no_x,no_y[],[] for i in range(len(reduced_x)):if y_train[i] 1:yes_x.append(reduced_x[i][0])yes_y.append(reduced_x[i][1])elif y_train[i]0:no_x.append(reduced_x[i][0])no_y.append(reduced_x[i][1]) plt.scatter(yes_x,yes_y,cr,markerx) plt.scatter(no_x,no_y,cb,markerD) plt.xlabel(First Main Component) plt.ylabel(Second Main Component) plt.show() 结果 可以看出2个主成分可以大概划分出两类。 作者简介 读研期间发表6篇SCI数据挖掘相关论文现在某研究院从事数据算法相关科研工作结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创以最简单的方式理解和学习关注我一起交流成长。需要数据集和源码的小伙伴可以关注底部公众号添加作者微信。
http://www.w-s-a.com/news/95030/

相关文章:

  • 南昌网站专业制作做仿站如何获取网站源码
  • qq钓鱼网站wordpress 企业站模板
  • 推进文明网站建设免费设计公司logo设计
  • 做电脑租赁网站server 2008 网站部署
  • 做网站的公司一年能赚多少钱wordpress作者增加分类插件
  • 苏州尚云网站建设专业摄影网站推荐
  • 020网站开发微信公众号直接链接网站怎么做
  • 学做烘焙的网站某网站注册需要邮箱是怎么弄
  • 网站的特效代码公司网站开发的工作内容
  • 网站制作哪家好商城网站建设预算要多少钱
  • 怎么做律所的官方网站微网站可以做商城吗
  • 通用网站后台管理系统(php版)网站备案ip查询网站查询
  • 制作网站代码吗江阴网站建设推广
  • 汕头建网站wordpress文章网址采集
  • 十大景观设计网站用vue框架做的网站
  • 福建省建设监理网官方网站做外贸网站卖什么东西好
  • 公司做网站排名东莞关键词优化推广
  • 连云港做企业网站公司全网营销与seo
  • 电子毕业设计代做网站wordpress 插件放在那
  • 黄石规划建设局网站怎么做存储网站
  • 网站安装wordpress滨江网站建设
  • 河南官网网站建设一般使用的分辨率显示密度是
  • dedecms新网站 上传到万网的空间宝洁公司网站做的怎么样
  • 网站建设语录优惠券的网站怎么做的
  • 白山市住房和建设局网站有实力高端网站设计地址
  • 沧州网站建设制作设计优化深圳网站自然优化
  • 企业做网站 乐云seowordpress中修改html
  • 网站细节门户wordpress主题下载
  • 全景网站模版wordpress套餐
  • 华为云建网站dw制作一个手机网站模板