当前位置: 首页 > news >正文

网站建设预算表制作oa系统费用报销流程

网站建设预算表制作,oa系统费用报销流程,短网址生成算法,会员卡管理系统代码决策树是一种树形结构的机器学习模型#xff0c;适用于分类和回归任务。它通过一系列基于特征的条件判断来将数据分割为多个子区域#xff0c;从而预测目标变量的值。 1. 决策树的结构 根节点#xff08;Root Node#xff09; 决策树的起点#xff0c;包含所有样本。根据某…决策树是一种树形结构的机器学习模型适用于分类和回归任务。它通过一系列基于特征的条件判断来将数据分割为多个子区域从而预测目标变量的值。 1. 决策树的结构 根节点Root Node 决策树的起点包含所有样本。根据某个特征的分割规则分裂。 内部节点Internal Nodes 每个节点表示一次分割划分标准。根据特定特征及阈值分裂为子节点。 叶子节点Leaf Nodes 决策树的终点包含分类结果或回归预测值。 2. 决策树的构造 划分准则分裂规则 构造决策树的核心是选择最优的特征和阈值进行分裂常用的准则包括 分类问题 信息增益Information Gain 分裂前的熵。分裂后每个子集的熵。 基尼指数Gini Index ​样本属于第 k 类的比例。决策树选择使基尼指数下降最多的分裂。 回归问题 均方误差Mean Squared Error, MSE 3. 决策树算法 ID3 算法 使用信息增益作为分裂准则。适用于分类问题。 C4.5 算法 改进 ID3支持连续特征。使用信息增益比作为分裂准则。 CARTClassification and Regression Tree 适用于分类和回归。分类使用基尼指数回归使用均方误差。 4. 决策树的优缺点 优点 易解释规则清晰直观理解。无需特征缩放对特征的分布和尺度不敏感。可处理非线性关系通过分裂捕捉复杂的非线性关系。 缺点 易过拟合树过深会导致模型对训练数据拟合过度。对噪声敏感数据中的异常值可能显著影响树的结构。不稳定性小的变化可能导致树结构发生较大改变。 5. 决策树的剪枝 为了防止过拟合决策树通常需要剪枝 预剪枝Pre-Pruning 在构造时提前停止分裂。条件达到最大深度、节点样本数小于阈值、分裂带来的增益不足。 后剪枝Post-Pruning 先构造完整树再从底部向上剪枝。剪枝条件剪枝后误差降低或复杂度减少。 6. 决策树在分类与回归中的应用 分类问题 用于多类别或二分类任务。叶子节点存储类别标签。 回归问题 用于预测连续值。叶子节点存储预测值通常为均值。 7. 决策树的实现 分类问题 from sklearn.tree import DecisionTreeClassifier from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score# 加载数据 iris load_iris() X_train, X_test, y_train, y_test train_test_split(iris.data, iris.target, test_size0.3, random_state42)# 创建决策树分类器 clf DecisionTreeClassifier(criteriongini, max_depth3, random_state42) clf.fit(X_train, y_train)# 预测 y_pred clf.predict(X_test) print(Accuracy:, accuracy_score(y_test, y_pred))输出结果 Accuracy: 1.0 回归问题 from sklearn.tree import DecisionTreeRegressor from sklearn.datasets import make_regression from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error# 生成数据 X, y make_regression(n_samples100, n_features1, noise0.1, random_state42) X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.3, random_state42)# 创建决策树回归器 reg DecisionTreeRegressor(criterionsquared_error, max_depth3, random_state42) reg.fit(X_train, y_train)# 预测 y_pred reg.predict(X_test) print(MSE:, mean_squared_error(y_test, y_pred))输出结果 MSE: 36.28620386292295 8. 决策树的可视化 代码示例 import numpy as np from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier, plot_tree import matplotlib.pyplot as pltiris load_iris() clf DecisionTreeClassifier(random_state1234) model clf.fit(iris.data, iris.target)# 将 iris.target_names 转换为列表 class_names_list list(iris.target_names)plot_tree(clf, feature_namesiris.feature_names, class_namesclass_names_list, filledTrue) plt.show()可视化结果 决策树图中显示特征的分裂规则、样本数量、类别比例等信息。有助于理解模型决策逻辑。 9. 决策树的扩展 随机森林Random Forest 使用多棵决策树结合集成学习Bagging。提升泛化性能减少过拟合。 梯度提升树Gradient Boosted Trees 以决策树为弱学习器通过梯度提升优化。 XGBoost / LightGBM / CatBoost 各种基于决策树的高效梯度提升框架。 决策树作为经典的机器学习模型易于理解且功能强大适合小规模数据集或需解释性强的任务。在实际应用中可以结合剪枝和集成学习来提升模型性能。
http://www.w-s-a.com/news/468495/

相关文章:

  • 斗图在线制作网站搜索关键词优化
  • 大连 网站建设 有限公司十大erp系统
  • 网站后台建设软件网络营销公司招聘
  • 做网站销售电销好做吗网站开发毕业设计代做
  • 成都学网站建设费用帝国cms与wordpress
  • 如何刷网站排名品牌设计的英文
  • 富阳有没有做网站的房产局官网查询系统
  • 建设网站列表aliyun oss wordpress
  • 做PPT的辅助网站wordpress拖拽式主题
  • 商城网站源码seo兼职58
  • 汽车租赁网站的设计与实现全网营销推广哪家正规
  • 做网站时怎么取消鼠标悬停如何设计软件界面
  • 建德网站设计公司中国十大热门网站排名
  • 网站与新媒体建设测评方案163企业邮箱官网入口
  • 怎样做下载网站页面设计参评
  • 哈尔滨住建局网站首页设计制作过程
  • php投资理财企业网站模板网站呼叫中心 建设工期
  • 查数据的权威网站silverlight 做的网站
  • 网站开发外包网站贵阳网站建设 网站制作
  • 官方微网站西安景观设计公司排行
  • 广州学做网站视频代做网站
  • 沈阳公司建站seo课程培训班
  • 杭州做微信网站软件公司网站建设毕业设计中期进度报告
  • 怎么做谷歌这样的网站如何建立一个网站放视频
  • 园区网站建设调研报告北京朝阳区哪里有网站开发
  • 网站角色权限wordpress 优化版
  • 购物网站ppt怎么做网络公司注册多少钱
  • 学做衣服上什么网站好贴吧高级搜索
  • 贵州 跨境电商网站建设做淘宝店铺有哪些好的网站
  • 广州正规网站制作公司网站搭建公司