当前位置: 首页 > news >正文

西安代做网站差异基因做热图在线网站

西安代做网站,差异基因做热图在线网站,档案网站建设与知识管理,shopping电商平台因果推断#xff08;三#xff09;双重差分法#xff08;DID#xff09; 双重差分法是很简单的群体效应估计方法#xff0c;只需要将样本数据随机分成两组#xff0c;对其中一组进行干预。在一定程度上减轻了选择偏差带来的影响。 因果效应计算#xff1a;对照组y在干预…因果推断三双重差分法DID 双重差分法是很简单的群体效应估计方法只需要将样本数据随机分成两组对其中一组进行干预。在一定程度上减轻了选择偏差带来的影响。 因果效应计算对照组y在干预前后的均值差 A ˉ 2 − A ˉ 1 \bar A_2 - \bar A_1 Aˉ2​−Aˉ1​实验组y在干预前后的均值差 B ˉ 2 − B ˉ 1 \bar B_2 - \bar B_1 Bˉ2​−Bˉ1​则因果效应 ( B ˉ 2 − B ˉ 1 ) − ( A ˉ 2 − A ˉ 1 ) (\bar B_2 - \bar B_1)-(\bar A_2 - \bar A_1) (Bˉ2​−Bˉ1​)−(Aˉ2​−Aˉ1​) 假设前提DID有一个很重要且很严格的平行趋势假设即实验组和对照组在没有干预的情况下结果的趋势是一样的。 准备数据 from faker import Faker from faker.providers import BaseProvider, internet from random import randint import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import math import statsmodels.formula.api as smf import warningswarnings.filterwarnings(ignore)# 绘图初始化 %matplotlib inline sns.set(styleticks)# 自定义数据 fake Faker(zh_CN) class MyProvider(BaseProvider):def myCityLevel(self):cl [一线, 二线, 三线, 四线]return cl[randint(0, len(cl) - 1)]def myGender(self):g [F, M]return g[randint(0, len(g) - 1)] fake.add_provider(MyProvider)# 构造假数据模拟用户特征 uid[] cityLevel[] gender[] for i in range(10000):uid.append(i1)cityLevel.append(fake.myCityLevel())gender.append(fake.myGender())raw_data pd.DataFrame({uid:uid,cityLevel:cityLevel,gender:gender,})raw_data[class] raw_data[uid].map(lambda x: A if x % 2 1 else B) # 按奇偶随机分组# 构造did数据 df pd.DataFrame(columns[uid,cityLevel,gender, class, sales, dt]) for i,j in enumerate(range(2005,2011)):lift 1i*0.05df_temp raw_data.copy()df_temp[sales] [int(x) for x in np.random.normal(300*lift, 60*lift, df_temp.shape[0])]df_temp[sales] df_temp.apply(lambda x: x.sales*0.88 if x[class]A else x.sales, axis1)if j2007:df_temp[sales] df_temp.apply(lambda x: x.sales*(1i*0.02) if x[class]B else x.sales, axis1)df_temp[dt] jdfpd.concat([df,df_temp])df_did df.groupby([class, dt])[sales].sum().reset_index()验证平行趋势假设 # 计算文字的y坐标 y_text df_did.query(dt 2007 and classB)[sales].values[0] # 绘图查看干预前趋势 fig, ax plt.subplots(figsize(12,8)) sns.lineplot(xdt, ysales, hueclass, datadf_did) ax.axvline(2007, colorr, linestyle--, alpha0.8) plt.text(2007, y_text, treatment) plt.show()除了画图观察平行趋势也可以通过回归拟合参考自如何使用Python计算双重差分模型 # 方法2 回归计算 df_did[t] df_did[treatment].map(lambda x: 1 if x干预后 else 0) # 是否干预后 df_did[g] df_did[class].map(lambda x: 1 if xB else 0) # 是否试验组 df_did[tg] df_did[t]*df_did[g] # 交互项# 回归 est smf.ols(formulasales ~ t g tg, datadf_did).fit() print(est.summary()) 可以看到交互项tg并不显著因此可以认为具备平行趋势 计算因果效应 # 计算因果效应 df_did[treatment] df_did[dt].map(lambda x: 干预后 if x2007 else 干预前) df_did_cal df_did.groupby([class, treatment])[sales].mean() did (df_did_cal.loc[B, 干预后] - df_did_cal.loc[B, 干预前]) - \(df_did_cal.loc[A, 干预后] - df_did_cal.loc[A, 干预前]) print(did)175541.82000000007总结 在实际业务中平行趋势假设是很难满足的因此常常会先进性PSM构造相似的样本这样两组群体基本上就会符合平行趋势假设了所以常见以PSMDID进行因果推断有兴趣的同学可以结合这两期的内容自行尝试。 共勉
http://www.w-s-a.com/news/49129/

相关文章:

  • 湖南智能网站建设哪家好wordpressμ
  • 公司网站备案必须是企业信息么睢宁县凌城做网站的
  • 上海网站建设公司 珍岛宁波免费自助建站模板
  • 南昌知名的网站建设公司南京网站开发选南京乐识赞
  • 外贸网站建设 深圳seo怎么提升关键词的排名
  • 网站推广效果的评价google关键词
  • 模板网站建站哪家好做微信充值网站
  • 抽奖的网站怎么做的广州小程序定制开发
  • 网站的文件夹建设企业网站公积金
  • 做网站的的价位网站建设 考试题目
  • 深圳比邻网站建设北京优化服务
  • 菏泽网站建设哪家好电子商务网络安全
  • 仿一个网站广州网站建设正规公司
  • 网站建设 目的seo网站关键词排名快速
  • 什么叫做响应式网站自媒体全平台发布
  • 企业网站 案例哪里需要人做钓鱼网站
  • 厚街东莞网站建设网站开发者调试模式
  • 网站推广营销联系方式wordpress adminlte
  • 哪些网站可以做文字链广告卖水果网站建设的策划书
  • 雕刻业务网站怎么做企业qq官网
  • 新华书店的做的数字阅读网站wordpress编辑器格式
  • jq做6个网站做什么好广西临桂建设局网站
  • 网站新闻图片尺寸南京网站设计公司
  • 重庆seo建站网站服务器 安全
  • 咸宁做网站的公司桂林网站建设兼职
  • 教做网站网站开发行业分析
  • 忻州网站建设培训友情链接交换形式有哪些
  • 佛山做外贸网站渠道外贸常用网站
  • 文章收录网站网站及新媒体建设办法
  • 招聘网站排行榜2021找建网站公司