当前位置: 首页 > news >正文

谷歌商店下载官方长沙专业网站优化定制

谷歌商店下载官方,长沙专业网站优化定制,安徽网站建设公司排名,wordpress中主题页脚太高怎么办随机森林#xff08;Breiman 2001a#xff09;#xff08;RF#xff09;是一种非参数统计方法#xff0c;需要没有关于响应的协变关系的分布假设。RF是一种强大的、非线性的技术#xff0c;通过拟合一组树来稳定预测精度模型估计。随机生存森林#xff08;RSF#xff0…随机森林Breiman 2001aRF是一种非参数统计方法需要没有关于响应的协变关系的分布假设。RF是一种强大的、非线性的技术通过拟合一组树来稳定预测精度模型估计。随机生存森林RSFIshwaran和Kogalur2007IshwaraanKogalur、Blackstone和Lauer2008是Breimans射频技术的延伸从而降低了对时间到事件数据的有效非参数分析。 R语言随机森林进行生存分析需要使用到randomForestSRC包是对Breimans随机森林的统一处理用于生存、回归和分类问题。randomForestSRC包还有一个用于做图的ggRandomForests包搭配使用今天咱们来介绍一下怎么使用randomForestSRC包进行随机森林生存分析内容有点多咱们分2章来介绍。 咱们先导入数据和R包 library(ggRandomForests) library(randomForestSRC) library(ggplot2) library(dplyr) pbc-read.csv(E:/r/test/pbc2.csv,sep,,headerTRUE)这是一个胆管炎数据公众号回复胆管炎数据2可以获得数据years:生存时间status结局指标是否死亡treatment是否DPCA治疗age年龄sex性别ascites是否有腹水hepatom是否有肝肿大spiders是否有蜘蛛痣edema水肿的级别bili胆红素chol胆固醇albumin白蛋白copper尿酮alk碱性磷酸酶sgotSGOT评分trig甘油三酯platelet血小板prothrombin凝血酶时间stage组织学分型 我们对数据处理一下把treatment这个变量变成因子 pbc$treatment-factor(pbc$treatment)接下来咱们把数据分成两组有treatment数据的为测试组treatment数据缺失的为对照组。 pbc.trial - pbc %% filter(!is.na(treatment)) pbc.test - pbc %% filter(is.na(treatment))我们先用生存分析做一遍等下可以和随机森林进行比较接下来我们用gg_survival对测试组生成生存分析的数据这个函数挺方便使用的生成了生存分析的详尽数据 gg_dta -gg_survival(interval years,censor status,by treatment,data pbc.trial,conf.int 0.95)绘图 plot(gg_dta) labs(y Survival Probability, x Observation Time (years),color Treatment, fill Treatment) theme(legend.position c(0.2, 0.2)) coord_cartesian(y c(0, 1.01))或者绘制成这种累积风险图 plot(gg_dta, type cum_haz) labs(y Cumulative Hazard, x Observation Time (years),color Treatment, fill Treatment) theme(legend.position c(0.2, 0.8)) coord_cartesian(ylim c(-0.02, 1.22))咱们还可以进行断点分层分析假如咱们对bili这个指标分层4个层(0, 0.8, 1.3, 3.4, 29) pbc.bili - pbc.trial pbc.bili$bili_grp - cut(pbc.bili$bili, breaks c(0, 0.8, 1.3, 3.4, 29)) plot(gg_survival(interval years, censor status, by bili_grp,data pbc.bili), error none) labs(y Survival Probability, x Observation Time (years),color Bilirubin)接下来咱们进行随机森林的生存分析nsplit定义的是随机拆分数一般默认10次na.action这里如果选择na.impute就是对缺失数据进行插补如果选择na.omit就是对缺失数据删除importance TRUE这里会计算重要的变量并且进行排序 rfsrc_pbc - rfsrc(Surv(years, status) ~ ., data pbc.trial,nsplit 10, na.action na.impute,tree.err TRUE,importance TRUE)查看下基本信息默认ntree是1000颗数No. of variables tried at each split: 5这里表示每次都随机取5个变量用于截点。在每个节点当终端节点包含三个或更少的观测值时停止。Rfsrc函数采用了一个随机logrank分割规则该规则从nsplit10中随机选择分割点值。 rfsrc_pbc程序选择63.2%的样本做估计剩余36.8%作为袋外数据OOB用于测试。gg_error函数对随机林rfsrc_pbc对象进行操作以提取错误作为森林中树木数量的函数的估计。 plot(gg_error(rfsrc_pbc))我们可以看到100颗数后误差已经很稳定了。gg_rfsrc函数可以提取随机森林中袋外数据OOB的估计值 out- gg_rfsrc(rfsrc_pbc)进一步绘图 ggRFsrc - plot(gg_rfsrc(rfsrc_pbc), alpha 0.2) theme(legend.position none) labs(y Survival Probability, x Time (years)) coord_cartesian(ylim c(-0.01, 1.01)) ggRFsrc对治疗组和未治疗组进行分类绘图 plot(gg_rfsrc(rfsrc_pbc, by treatment)) theme(legend.position c(0.2, 0.2)) labs(y Survival Probability, x Time (years)) coord_cartesian(ylim c(-0.01, 1.01))使用验证组就行数据评估 rfsrc_pbc_test - predict(rfsrc_pbc, newdata pbc.test,na.action na.impute,importance TRUE)绘图 plot(gg_rfsrc(rfsrc_pbc_test), alpha.2) #scale_color_manual(values strCol) theme(legend.position none) labs(y Survival Probability, x Time (years)) coord_cartesian(ylim c(-0.01, 1.01))因为咱们选的是treatment缺失的为验证集这里就不能分组了。 随机林不是一种简约方法而是使用数据集中所有可用的变量以构建响应预测器。此外与参数模型不同随机森林不会要求明确说明协变量对响应的函数形式。因此对于随机森林模型的变量选择没有明确的p值/显著性检验。相反RF通过分割规则确定哪些变量对预测有贡献优化最佳选择分离观察的变量。 下面来做变量的重要性VIMP方法使用一种预测误差方法包括依次对每个变量进行“noising-up”。 由于VIMP是排列前后OOB预测误差的差异VIMP值表示错误指定会降低森林中的预测准确性。VIMP接近零表示该变量对预测准确性没有任何贡献并且负值表示当变量被错误指定时预测精度提高。 plot(gg_vimp(rfsrc_pbc)) theme(legend.position c(0.8, 0.2)) labs(fill VIMP 0)本期先介绍到这里未完待续。
http://www.w-s-a.com/news/158224/

相关文章:

  • 网页设计与网站建设书籍包头住房与城乡建设局网站
  • 重庆网站建设平台免费猎头公司收费收费标准和方式
  • 形象设计公司网站建设方案书打开一个不良网站提示创建成功
  • 网站手机页面如何做网站关键字 优帮云
  • 免费的黄冈网站有哪些下载软件系统软件主要包括网页制作软件
  • 企业微站系统重庆高端网站建设价格
  • 有没有做衣服的网站吗网站自适应开发
  • 青海省制作网站专业专业定制网吧桌椅
  • 网站开发的项目17岁高清免费观看完整版
  • 手机网站建设多少钱一个门网站源码
  • 重庆 网站开发天津住房和城乡建设厅官方网站
  • 泰安高级网站建设推广厦门高端网站建设定制
  • jsp网站开发引用文献手机seo排名
  • 创建一家网站如何创设计网页的快捷网站
  • 1688代加工官方网站h5开发教程
  • 静态网站源码下载网站怎么显示备案号
  • 网站代码设计网站开发维护任职要求
  • 长寿做网站的电话怎么快速刷排名
  • 上海市中学生典型事例网站邯郸全网推广
  • 厦门网站建设680元好男人的最好的影院
  • 石家庄网站建设设计产品设计专业就业前景
  • 网站移动排名做最好最全的命理网站
  • 网站怎么防黑客杭州市做外贸网站的公司
  • 网站推广公司认准乐云seo易语言做网站登录
  • 配色设计网站推荐网站下拉菜单重叠
  • 内容展示型网站特点在北京注册公司需要多少钱
  • h5网站源代码创意设计理念
  • 岳阳网站开发服务推广运营平台
  • 网站开发得多长时间湖南建设人力资源网证书查询
  • 论坛网站开发网络营销是什么时候产生的