当前位置: 首页 > news >正文

检察院门户网站建设情况总结深圳网站制作长沙

检察院门户网站建设情况总结,深圳网站制作长沙,培训机构网站建设推广,局网站建设工作征求意见什么是网格搜索#xff1f; 网格搜索是一种参数调优的方法#xff0c;它可以帮助找到最佳的模型参数。在网格搜索中#xff0c;我们先指定参数的候选值范围#xff0c;然后枚举所有可能的参数组合#xff0c;计算每个模型的性能指标#xff08;比如准确率、精确率等 网格搜索是一种参数调优的方法它可以帮助找到最佳的模型参数。在网格搜索中我们先指定参数的候选值范围然后枚举所有可能的参数组合计算每个模型的性能指标比如准确率、精确率等。最后选择性能指标最优的那个参数组合作为最终的模型参数。网格搜索的名称来源于我们将参数的候选值范围表示为一个二维的参数网格。 scikit-learn GridSearchCV类介绍 API Reference — scikit-learn 1.4.0 documentation sklearn.model_selection.GridSearchCV — scikit-learn 1.4.0 documentation  重要参数说明 estimator要优化的模型对象。param_grid指定参数的候选值范围可以是一个字典或列表。scoring性能评估方法。n_jobs并行运行的作业数。refit是否在找到最佳参数后在整个数据集上重新拟合估计器。cv交叉验证生成器或可迭代的产生训练/验证集的拆分器。verbose详细程度。pre_dispatch控制在并行执行期间调度的作业数。当调度的作业比CPU处理的作业多时减少这个数字有助于避免内存消耗的爆炸式增长。error_score如果估算器拟合中出现错误则分配给分数的值。。return_train_score是否返回训练评分。 重要属性说明 best_estimator_返回在交叉验证中选择的最佳估计器。best_params_返回在交叉验证中选择的最佳参数组合。best_score_返回在交叉验证中选择的最佳评分。cv_results_返回一个字典其中包含网格搜索期间计算出的所有性能指标和参数设置的详细信息。scorer_返回用于评分的评估器。n_splits_返回交叉验证折叠数。 这些属性可以提供有关在网格搜索期间发生的事件和结果的详细信息包括最佳模型、最佳参数和最佳评分等。您可以根据需要使用这些属性来进一步分析优化的结果。 scikit-learn GridSearchCV类使用案例 # 导入依赖包 from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import GridSearchCV from sklearn.model_selection import cross_val_score import matplotlib.pyplot as plt import pandas as pd import numpy as np# 导入乳腺癌数据集探索数据 data load_breast_cancer() print(data.data.shape) # 可以看到乳腺癌数据集有569条记录30个特征单看维度虽然不算太高但是样本量非常少。过拟合的情况可能存在。 print(data.data[0:5]) print(data.target.shape) print(data.target[0:5]) print(data.feature_names) print(data.target_names) # 进行一次简单的建模看看模型本身在数据集上的效果 rfc RandomForestClassifier(n_estimators10, random_state90) score_pre cross_val_score(rfc, data.data, data.target,cv10).mean() score_pre # 这里可以看到随机森林在乳腺癌数据上的表现本就还不错在现实数据集上基本上不可能什么都不调就看到95%以上的准确率 # 开始按照参数对模型整体准确率的影响程度进行调参首先调整max_depth #调整max_depth param_grid {max_depth:np.arange(1, 20, 1)} # 一般根据数据的大小来进行一个试探乳腺癌数据很小所以可以采用1~10或者1~20这样的试探 # 但对于像digit recognition那样的大型数据来说我们应该尝试30~50层深度或许还不足够 # 更应该画出学习曲线来观察深度对模型的影响 rfc RandomForestClassifier(n_estimators73,random_state90) GS GridSearchCV(rfc, param_grid, cv10) GS.fit(data.data,data.target) print(GS.best_params_) print(GS.best_score_) plt.figure(figsize[20,5]) plt.plot(range(1,20), GS.cv_results_[mean_test_score]) plt.ylabel(score) plt.xlabel(max_depth) plt.xticks(range(1,21)) plt.show() 更多详细信息可以阅读[Python] 什么是集成算法什么是随机森林随机森林分类器RandomForestClassifier及其使用案例-CSDN博客 的“案例二乳腺癌数据集进行随机森林调参”。
http://www.w-s-a.com/news/647003/

相关文章:

  • 单页导航网站模板搜索量查询
  • 如何在一个地方建设网站营销型定制网站
  • 保定网站建设方案维护动易网站中添加邮箱
  • 简易网站的html代码wordpress音乐html
  • 四川住房和城乡建设厅网站打不开海山网站建设
  • 深圳设计功能网站如何用html制作网站
  • 网络优化软件下载竞价排名和seo的区别
  • 龙华新区做网站中高端网站建设
  • 网站开发小图标大全手机网站设计开发
  • 网页设计设计一个网站口碑营销的优点
  • 枣庄建网站的公司唐山企业网络推广培训
  • 张家界建设企业网站学校资源网站建设方案
  • 网站制作教程书籍业务管理系统
  • 上传网站空间的建站程序怎么删除c 网站开发案例详解下载
  • 企业网站维护兼职丹阳网站优化
  • 秦皇岛网站开发公司怎么注册自己的公司
  • 写作网站哪个能得稿费绿色环保企业网站模板
  • 牡丹江网站建设定制开发安徽建设工程信息网官网入口
  • 有什么好的网站建设的书适合在家做的网站工作
  • wordpress情侣源码西安网站快速优化
  • 昆明网站建设高端定制100种班服设计图
  • 网站开发程序说明html网页制作接单
  • 企业网站货物查询怎么做制作文件的软件
  • 怎么做网站的防盗链北京门户企业网站建设
  • 网站推广的主流方法淘客网站 源码
  • 网站海外推广怎么做多用户商城系统源码教程
  • 猎头做单网站网站创建费用
  • 住房和城乡建设网站 上海自己做网站还是公众号
  • 投票网站怎么制作电商网站模板html
  • 攀枝花移动网站建设抖音广告投放平台