当前位置: 首页 > news >正文

建设网站公司哪好长沙优化网站哪家公司好

建设网站公司哪好,长沙优化网站哪家公司好,网站建设全部代码,免费行情网站排名VCNet论文阅读笔记 0、基本信息 信息细节英文题目VCNet and Functional Targeted Regularization For Learning Causal Effects of Continuous Treatments翻译VCNet和功能目标正则化用于学习连续处理的因果效应单位芝加哥大学年份2021论文链接[2103.07861] VCNet和功能定向正…VCNet论文阅读笔记 0、基本信息 信息细节英文题目VCNet and Functional Targeted Regularization For Learning Causal Effects of Continuous Treatments翻译VCNet和功能目标正则化用于学习连续处理的因果效应单位芝加哥大学年份2021论文链接[2103.07861] VCNet和功能定向正则化用于学习连续处理的因果效应 (arxiv.org)代码链接https://github.com/lushleaf/varying-coefficient-net-with-functional-tr发表会议ICLR 2021 Conference Program Chairs 1、摘要 背景因果推断casual inference在智能营销、药物治疗、决策上有广泛的应用比如优惠券对用户购买意愿的影响、药品多大程度改善或治愈疾病、某项政策提高多少就业率等。即预估一种干预因素treatment对结果outcome的影响treatment effect本文的目标问题就是获得ADRF曲线平均剂量反应曲线x轴是药物浓度treatmenty轴是患者效果outcome。 存在问题 大多数uplift相关的论文都是关于binary treatment的因果效应估计然而现实生活中我们却经常遇到连续treatment (continues treatment)的情况。比如电商发放优惠券的满减金额是连续的医生给病人开药的剂量是连续。那么我们应该如何对continues treatment对情况进行因果效应估计呢 以前解决连续treatment的方法是将连续treatment分成多个blocks使用不同的head处理不同的block但是这样获得的outcome是不连续的对应下图的Drnet曲线。 神经网络处理这个问题大多是神经网络第一层是 ( t , x ) (t,x) (t,x)最后一层是 y y y这样做会存在treatment可能会在高维度表征中丢失的问题以前的处理方法是将 t t t加到每个隐藏层上但是这样做让预测更加的不连续。 文章贡献 提出一个可变系数神经网络VCNet能处理连续干预的网络结构 推广了目标正则化以获得整个ADRF曲线的双重鲁棒估计。 2、问题陈述和建模 iid 样本 { ( y _ i , x _ i , t _ i ) } _ i 1 n \{(y\_i,\boldsymbol{x}\_i,t\_i)\}\_{i1}^n {(y_i,x_i,t_i)}_i1n其中X是协变量向量T是连续treatment[0,1]Y是结果 目标就是求平均剂量反应函数 ψ ( t ) E ( Y ∣ do ( T t ) ) \psi(t)\mathbb{E}(Y\mid\text{do}(Tt)) ψ(t)E(Y∣do(Tt)) 这里的 do 操作符表示“干预”或“人为设置”处理变量 为 。这意味着我们要考虑的是如果我们强制将处理设置为 在这种情况下 的期望值。 患者年龄 X治疗水平 T结果 Y1300.522300.533500.544800.51 ψ ( 0.5 ) E ( Y ∣ do ( T 0.5 ) ) \psi(0.5)\mathbb{E}(Y\mid\text{do}(T0.5)) ψ(0.5)E(Y∣do(T0.5)) 但在实际应用中我们通常不能直接进行干预实验我们只能观察到变量间的关系。在观察性数据中我们常常用条件期望来替代这个干预性期望。我们需要将这个理论性的期望转换为可实际计算的形式。 ψ ( t ) E ( Y ∣ do ( T t ) ) E ( E ( Y ∣ X , T t ) ) \psi(t)\mathbb{E}(Y\mid\text{do}(Tt))\mathbb{E}(\mathbb{E}(Y|X,Tt)) ψ(t)E(Y∣do(Tt))E(E(Y∣X,Tt)) ψ ( 0.5 ) E ( Y ∣ do ( T 0.5 ) ) E ( E ( Y ∣ X , T 0.5 ) ) \psi(0.5)\mathbb{E}(Y\mid\text{do}(T0.5))\mathbb{E}(\mathbb{E}(Y|X,T0.5)) ψ(0.5)E(Y∣do(T0.5))E(E(Y∣X,T0.5)) E ( Y ∣ 30 , T 0.5 ) ( 2 3 ) / 2 2.5 \mathbb{E}(Y|30,T0.5) (23)/2 2.5 E(Y∣30,T0.5)(23)/22.5 E ( Y ∣ 50 , T 0.5 ) 4 \mathbb{E}(Y|50,T0.5) 4 E(Y∣50,T0.5)4 E ( Y ∣ 80 , T 0.5 ) 1 \mathbb{E}(Y|80,T0.5) 1 E(Y∣80,T0.5)1 ψ ( 0.5 ) E ( E ( Y ∣ X , T 0.5 ) ) E ( E ( Y ∣ 30 , T 0.5 ) E ( Y ∣ 50 , T 0.5 ) E ( Y ∣ 80 , T 0.5 ) ) \psi(0.5)\mathbb{E}(\mathbb{E}(Y|X,T0.5)) \mathbb{E}(\mathbb{E}(Y|30,T0.5)\mathbb{E}(Y|50,T0.5)\mathbb{E}(Y|80,T0.5)) ψ(0.5)E(E(Y∣X,T0.5))E(E(Y∣30,T0.5)E(Y∣50,T0.5)E(Y∣80,T0.5)) ψ ( 0.5 ) \psi(0.5) ψ(0.5) ( 2.5 4 1 ) / 3 2.42 (2.541)/3 2.42 (2.541)/32.42 但是这里面存在一个问题年长的患者可能更容易在同一治疗水平下有不同的结果X存在混杂因素。 解决方案 提出一个广义倾向性得分的概念 E ( E ( Y ∣ X , T t ) ) \mathbb{E}(\mathbb{E}(Y|X,Tt)) E(E(Y∣X,Tt))需要结合所有与 相关的信息来进行计算。然而当你面对的是复杂的数据有时通过所有的 来进行估计会引入噪声或混杂因素。 使用 π ( t ∣ x ) \pi(t|x) π(t∣x)代表患者接受treatment的概率 P ( t ∣ x ) P(t|x) P(t∣x) 倾向评分提供了一种将多维数据特征 映射到一维治疗概率的方法。这一映射使得我们能够更有效地建模和学习潜在的因果关系。 ψ ( t ) E ( Y ∣ do ( T t ) ) E ( E ( Y ∣ X , T t ) ) E ( E ( Y ∣ π ( t ∣ x ) , T t ) ) \psi(t)\mathbb{E}(Y\mid\text{do}(Tt))\mathbb{E}(\mathbb{E}(Y|X,Tt)) \mathbb{E}(\mathbb{E}(Y|\pi(t|x),Tt)) ψ(t)E(Y∣do(Tt))E(E(Y∣X,Tt))E(E(Y∣π(t∣x),Tt)) π ( 0.5 ∣ 30 ) 0.4 \pi(0.5|30) 0.4 π(0.5∣30)0.4 π ( 0.5 ∣ 50 ) 0.3 \pi(0.5|50) 0.3 π(0.5∣50)0.3 π ( 0.5 ∣ 80 ) 0.3 \pi(0.5|80) 0.3 π(0.5∣80)0.3 ψ ( 0.5 ) E ( E ( Y ∣ π ( t ∣ x ) , T t ) ) ( 2.5 ∗ 0.4 4 ∗ 0.3 1 ∗ 0.3 ) / 1 2.5 \psi(0.5) \mathbb{E}(\mathbb{E}(Y|\pi(t|x),Tt))(2.5* 0.44* 0.31* 0.3)/1 2.5 ψ(0.5)E(E(Y∣π(t∣x),Tt))(2.5∗0.44∗0.31∗0.3)/12.5 通过这个过程我们减少了由 引入的潜在偏倚使得结果 更好地反映了治疗的真实效果。 3、VCNet模型原理 3.1 基本结构 先使用简单的神经网络估计 π ( t ∣ x ) \pi(t|x) π(t∣x)之后使用VCNet得到预测结果 3.1 (|)估计 由于本文所提到的treatment是连续的因此本文将treatment分成了B个grid区间通过softmax转化成一个多分类问题再通过差值估计得到最后的估计结果。 π _ g r i d N N ( x ) s o f t m a x ( w z ) \pi\_{grid}^{NN}(x)softmax(wz) π_gridNN(x)softmax(wz) π N N ( t ∣ x ) π _ g r i d t _ 1 , N N ( x ) B ( π _ g r i d t _ 2 , N N ( x ) − π _ g r i d t _ 1 , N N ( x ) ) ( t − t _ 1 ) \\\pi^{NN}(t|x)\pi\_{grid}^{t\_1,NN}(x)B(\pi\_{grid}^{t\_2,NN}(x)-\pi\_{grid}^{t\_1,NN}(x))(t-t\_1) πNN(t∣x)π_gridt_1,NN(x)B(π_gridt_2,NN(x)−π_gridt_1,NN(x))(t−t_1) 3.2 VCNet变系数估计 那如何得到变系数VCNet中采用样条估计得到 ()样条通过对间断点处的导数进行约束可以实现间断点处的连续性。 一些简单的数学知识可以参考码农小哥一文读懂三次样条、曲线连续 假设 θ _ i ( t ) ∑ _ l 1 L a _ i , l ϕ _ l N N ( t ) \theta\_i(t)\sum\_{l1}^La\_{i,l}\phi\_l^{NN}(t) θ_i(t)∑_l1La_i,lϕ_lNN(t)KaTeX parse error: Undefined control sequence: \[ at position 11: \theta(t)\̲[̲\theta\_{1}(t),… () 是 () 的维度。 则 其中 { ϕ _ l N N ( t ) } _ l 1 L \left\{\phi\_{l}^{NN}(t)\right\}\_{l1}^{L} {ϕ_lNN(t)}_l1L为样条基 , 为系数。则我们有 这里样条基的形式可以任意选择假设以DRNet的多头形式估计变系数DRNet其实也是VCNet的一个特例。 3.3 损失函数 同时优化π和μ 得到最优解 4、结果 从论文实验效果上看VCNet对连续treatment的估计效果确实挺好的同时加上DR也能很好的提升效果。 参考 连续干预下的深度因果推断 – VCNet解读 - 知乎 (zhihu.com) 因果推断笔记 | 连续型treatment因果效应估计之DRNetVCNet - 知乎 (zhihu.com)
http://www.w-s-a.com/news/405091/

相关文章:

  • 苏州网站建设系统方案成都行业网站设计
  • wordpress多说读者墙seo分析师招聘
  • 视频网站开发计划书wordpress文件详情
  • 重庆付费网站推广电商网站 开发周期
  • thinkcmf 做企业网站视频播放类网站建设费用
  • vps网站助手大学选修课网站建设
  • 南浦电商网站建设北京海淀社保网站
  • 传奇网站模板怎么做的吗大连警方最新通告
  • 成都私人做公司网站的北京网站建设需要多少钱
  • 魔客吧是什麼程序做的网站代理厦门网站设计公司
  • 90设计手机站东营网站推广
  • 哪家购物网站建设好专门做水生植物销售网站
  • php医院网站开发兼职app开发网上app开发
  • 接任务做兼职的的网站衡阳手机网站设计
  • 徐州经济开发区网站佛山百度关键词seo外包
  • 肃宁网站建设有限责任公司法人承担什么责任
  • 珠海斗门建设局网站如何免费做网站
  • 自助外贸网站建设可直接打开网站的网页
  • 江苏城嘉建设工程有限公司网站潍坊网站定制公司
  • 四川省住房和城乡建设厅新网站宜昌建设厅网站
  • 建设网站一般流程建设开发网站
  • 设计外贸英文网站国家企业信息信用公信系统
  • 主题资源网站创建时 如何突出设计的特点阿里云是做网站的吗
  • 乌市建设工程质量监督站网站外资公司注册
  • 档案馆网站机房建设做游戏网站打鱼
  • 网站建设平台 创新模式搭建好ftp服务器 如何通过网站访问
  • 苏州集团网站制作设计网页制作软件ai
  • 网站建设新手教程视频教程手帐风格wordpress主题
  • 做投标网站条件网站更改指定字段
  • mvc5 网站开发之美做印刷网站公司