当前位置: 首页 > news >正文

互联网网站排名济南seo公司案例

互联网网站排名,济南seo公司案例,网站建设画册,专业做外贸网站t-sne t-SNE#xff08;t-分布随机邻域嵌入#xff0c;t-distributed Stochastic Neighbor Embedding#xff09;是由 Laurens van der Maaten 和 Geoffrey Hinton 于 2008 年提出的一种非线性降维技术。它特别适合用于高维数据的可视化。t-SNE 的主要目标是将高维数据映射…t-sne t-SNEt-分布随机邻域嵌入t-distributed Stochastic Neighbor Embedding是由 Laurens van der Maaten 和 Geoffrey Hinton 于 2008 年提出的一种非线性降维技术。它特别适合用于高维数据的可视化。t-SNE 的主要目标是将高维数据映射到低维空间通常是二维或三维同时尽可能地保留高维数据中的局部结构。这使得我们可以在低维空间中更直观地观察数据的结构和分布。 t-SNE 能很好地保留高维数据的局部结构适用于各种类型的数据尤其是复杂的非线性数据。但它的计算复杂度较高不适合非常大规模的数据集对超参数如 perplexity较为敏感需要仔细调参。低维空间中的全局结构不一定可靠。 可视化 要使用 t-SNE 进行数据可视化可以使用 Python 的 scikit-learn 库。随机生成两个数据集 import matplotlib.pyplot as plt import numpy as np from sklearn.manifold import TSNE# 假设这里有两个数据集分别是 dataset1 和 dataset2 dataset1 np.random.randn(100, 10) # 生成随机数据作为示例 dataset2 np.random.randn(80, 10)# 合并数据集 merged_data np.concatenate((dataset1, dataset2))# 对合并后的数据应用 t-SNE 进行降维 tsne TSNE(n_components2, random_state0) tsne_data tsne.fit_transform(merged_data)# 将降维后的数据按照原来的数据集进行划分 tsne_data_1 tsne_data[:len(dataset1)] tsne_data_2 tsne_data[len(dataset1):]# 绘制散点图 plt.scatter(tsne_data_1[:, 0], tsne_data_1[:, 1], colorb, labelDataset 1) plt.scatter(tsne_data_2[:, 0], tsne_data_2[:, 1], colorr, labelDataset 2) plt.legend() plt.show()根据数据集中不同的标签使用不同的颜色 import numpy as np import pandas as pd from sklearn.manifold import TSNE import matplotlib.pyplot as pltfrom utils.feature import features18_df pd.read_csv(68.csv)X df[features18_] # 选择需要的特征 y df[fs] # 根据fs标签选择不同的颜色画图# 初始化 t-SNE 模型设置降维后的维度为 2 维 tsne TSNE(n_components2, perplexitymin(10, len(X)-1))# 对数据进行降维 X_tsne tsne.fit_transform(X)# 绘制结果 plt.figure(figsize(10, 10)) plt.scatter(X_tsne[:, 0], X_tsne[:, 1], cy.astype(int), cmapjet) plt.colorbar() plt.show()t-SNE的参数 t-SNE 类的 init 方法定义了用于初始化 t-SNE 对象的参数。下面是这些参数的详细介绍 n_componentsint, 默认值2 要降维到的维度数。通常设为2或3用于可视化。 perplexityfloat, 默认值30.0 衡量数据局部结构的一个超参数。较大的 perplexity 使 t-SNE 关注更大范围的邻居数。有效范围通常在5到50之间。 early_exaggerationfloat, 默认值12.0 在早期阶段增加距离以便于更好地形成群体结构。较高的值使得群体更加分离。 learning_ratefloat 或 “auto”, 默认值“auto” 学习率。学习率过低可能导致优化停滞学习率过高可能导致嵌入结构被破坏。当设为 “auto” 时学习率为 max(N / early_exaggeration / 4, 50)其中 N 是样本数。 n_iterint, 默认值1000 梯度下降迭代次数。增大此值可能会提升嵌入的质量。 n_iter_without_progressint, 默认值300 在没有进展的情况下提前终止的迭代次数。用于防止无效计算。 min_grad_normfloat, 默认值1e-7 最小梯度范数用于判断是否收敛。 metricstring 或 callable, 默认值“euclidean” 用于计算高维空间距离的度量标准。默认是欧几里得距离。 metric_paramsdict 或 None, 默认值None 用于度量的额外关键字参数。 initstring 或 ndarray, 默认值“pca” 低维嵌入的初始化方法。可以是 ‘random’ 或 ‘pca’也可以提供一个初始位置的数组。 verboseint, 默认值0 控制输出的详细程度。0 表示不输出1 或更高的值表示输出更多信息。 random_stateint, RandomState 实例或 None, 默认值None 随机数生成器的种子。设置此参数以获得可重复的结果。 methodstring, 默认值“barnes_hut” 用于计算嵌入的算法。可选值有 ‘barnes_hut’适用于较大数据集和 ‘exact’适用于较小数据集。 anglefloat, 默认值0.5 仅在 method‘barnes_hut’ 时使用。控制 Barnes-Hut 近似的精度值越小精度越高计算时间越长。 n_jobsint 或 None, 默认值None 并行计算的 CPU 核心数。None 表示 1-1 表示使用所有可用的核心。 生成excel文件 用python的matplotlib库作出的图可以看但并不完美虽然可以通过调matplotlib的参数来使图画得更完美但是不如使用专业的画图软件方便比如微软的visio爱不释手所以我们需要将t-SNE降维的坐标点生成一个excel文件在画图软件中导入这个excel文件使可视化变得更完美。将t-SNE降维后的数据保存到Excel文件中可以使用 pandas 库中的 to_excel 方法。 df pd.DataFrame(X_tsne) writer pd.ExcelWriter(arr.xlsx) df.to_excel(writer) writer.close()
http://www.w-s-a.com/news/491747/

相关文章:

  • 制作网站报价工程项目查询哪个网站
  • 深圳移动网站建设制作公司网站建设的认识
  • 网站建设脚本语言有哪些想开网店哪个平台好
  • 视频网站用什么做的好深圳的小程序开发公司
  • 南京网站定制开发商城网站免费模板
  • 青海学会网站建设公司照片组合拼图
  • 中国建设银行福清分行网站爱站网权重查询
  • 外贸通网站建设网站建设7个主要流程图
  • 元气森林网络营销方式医疗网站优化怎么做
  • 手机网站制作报价表做网站公司做网站公司
  • 湖州网站设计吉林网站建设哪家好
  • 做存储各种环境信息的网站使用tag的网站
  • 阿里云用ip做网站网站开发员属于
  • 外链网盘下载南宁seo推广优化
  • 网站的推广方案有哪些此网站可能有
  • wordpress更改链接后网站打不开一键生成个人网站
  • 网站建设后台有哪些东西前端开发培训一般多少钱
  • 高端建设网站公司网站开发 源码
  • 企业网站的劣势园林景观设计公司简介范文
  • 网站建设程序招聘东营建设信息网登录
  • o2o是什么意思通俗讲seo与网站优化 pdf
  • 外贸网站外包一般建设一个网站多少钱
  • 抄袭别人网站的前端代码合法吗网络促销策略
  • 用wordpress制作网站做资源网站
  • wordpress 发布网站南宁网站建设网站
  • 职业生涯规划大赛心得贵阳哪家网站做优化排名最好
  • wordpress 图片懒加载北京网站优化和推广
  • 深圳网站建设工作一个dede管理两个网站
  • 被禁止访问网站怎么办中国建筑网官网查询系统
  • 网站管理运营建设网贷网站