因果推断
[[因果推断方法]]
从结果估计原因 $$P(Y|do(X))$$
因果推断 ( Causal Inference ) 作为新兴的人工智能技术方向,旨在突破传统数据分析和机器学习方法的瓶颈,建模大规模数据集中的因果关系,为干预手段的设计提供指导,为构建下一代面向用户增长的全域分发系统提供理论基石。
正确区分因果关系和相关关系的方法论
核心课题
- 从众多观测到/未观测到的变量中找出致因 ( causes )
- 预估某个行为/因素的影响力/效益 ( causal effect )
核心是寻找反事实 ( counterfactual ) 镜像
随机对照实验的局限性
[[因果关系阶梯]]:关联、干预、反事实
因果建模方式
- 有随机控制实验 RCT Randomized Controlled Trial
- 根据控制变量去随机分组
- 耗时,非道德
- 观测研究 Observational Study
- 每个样本的 treatment 不是随机的
- [[Potential Outcome Framework]] Rubin Causal Model
- 不可观测变量转化成可观测变量
[[匹配法]]
[[UPlift Model]]
- [[Uplift Model 评估]]
- [[Uplift Curve]]
- [[Meta-Learner]]
- [[S-Learner]] one-model 的差分响应模型
- [[T-Learner]] two-model 差分响应模型
- [[X-Learner]] 基于 T-Learner的反事实推断模型
- [[R-Learner]] 通过 Robinson’s transfomation 定义一个损失函数,然后通过最小化损失函数的方法达到对增量进行建模的目的。
[[Ref]]
- 统计之都 因果推断 系列
- [[Using Causal Inference to Improve the Uber User Experience]]
- Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution
- [[因果推断在阿里文娱用户增长中的应用]]
- 因果阶梯与Do-演算:怎样完美地证明吸烟致癌?
- 吸烟基因导致尼古丁上瘾和肺癌