因果推断
[[因果推断方法]]
从结果估计原因 $$P(Y|do(X))$$
因果推断 ( Causal Inference ) 作为新兴的人工智能技术方向,旨在突破传统数据分析和机器学习方法的瓶颈,建模大规模数据集中的因果关系,为干预手段的设计提供指导,为构建下一代面向用户增长的全域分发系统提供理论基石。
正确区分因果关系和相关关系的方法论
核心课题
-
从众多观测到/未观测到的变量中找出致因 ( causes )
-
预估某个行为/因素的影响力/效益 ( causal effect )
核心是寻找反事实 ( counterfactual ) 镜像
随机对照实验的局限性
[[因果关系阶梯]]:关联、干预、反事实
因果建模方式
-
有随机控制实验 RCT Randomized Controlled Trial
-
根据控制变量去随机分组
-
耗时,非道德
-
-
观测研究 Observational Study
-
每个样本的 treatment 不是随机的
-
[[Potential Outcome Framework]] Rubin Causal Model
- 不可观测变量转化成可观测变量
-
[[匹配法]]
[[UPlift Model]]
-
[[Uplift Model 评估]]
-
[[Uplift Curve]]
-
-
[[S-Learner]] one-model 的差分响应模型
-
[[T-Learner]] two-model 差分响应模型
-
[[X-Learner]] 基于 T-Learner的反事实推断模型
-
[[R-Learner]] 通过 Robinson’s transfomation 定义一个损失函数,然后通过最小化损失函数的方法达到对增量进行建模的目的。
-
[[Ref]]
-
TODO 统计之都 因果推断 系列
-
[[Using Causal Inference to Improve the Uber User Experience]]
-
Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution
-
[[因果推断在阿里文娱用户增长中的应用]]
-
- 吸烟基因导致尼古丁上瘾和肺癌