因果推断

[[因果推断方法]]

从结果估计原因 $$P(Y|do(X))$$

因果推断 ( Causal Inference ) 作为新兴的人工智能技术方向,旨在突破传统数据分析和机器学习方法的瓶颈,建模大规模数据集中的因果关系,为干预手段的设计提供指导,为构建下一代面向用户增长的全域分发系统提供理论基石。

正确区分因果关系和相关关系的方法论

核心课题

  • 从众多观测到/未观测到的变量中找出致因 ( causes )

  • 预估某个行为/因素的影响力/效益 ( causal effect )

核心是寻找反事实 ( counterfactual ) 镜像

随机对照实验的局限性

[[因果关系阶梯]]:关联、干预、反事实

因果建模方式

  • 有随机控制实验 RCT Randomized Controlled Trial

    • 根据控制变量去随机分组

    • 耗时,非道德

  • 观测研究 Observational Study

[[匹配法]]

[[UPlift Model]]

  • [[Uplift Model 评估]]

  • [[Uplift Curve]]

  • [[Meta-Learner]]

    • [[S-Learner]] one-model 的差分响应模型

    • [[T-Learner]] two-model 差分响应模型

    • [[X-Learner]] 基于 T-Learner的反事实推断模型

    • [[R-Learner]] 通过 Robinson’s transfomation 定义一个损失函数,然后通过最小化损失函数的方法达到对增量进行建模的目的。

[[Ref]]

作者

Ryen Xiang

发布于

2024-10-05

更新于

2025-04-22

许可协议


网络回响

评论