T-Learner

image.png

+

  • 训练模型方式 #card

    • 将控制组样本和干预组样本分别用于训练模型 $M_0$ 和 $M_1$ (Two,T 的由来),分别学习 $M_0(X) = E(Y|T=0,X)$ 和 $M_1(X) = E(Y|T=1,X)$ 。
  • 如何预测 #card

    • 在预测时对于同一份样本分别经过 $M_0$ 和 $M_1$ ,最终的 CATE 估计为 $\hat{\tau}(x)_i=M_1(X_i)-M_0(X_i)$
  • 优点:#card

    • 对干预组 / 控制组样本分别建模,充分考虑了干预变量的影响。
  • 缺点:#card

    • 两个模型训练 bias 不一致,容易有累积误差

    • 干预组样本较少可能导致 $M_1$ 过拟合,因此只能降低 $M_1$ 的复杂度,这会导致 $M1$ 和 $M_2$ 存在差异,影响最终的因果效果估计准度。

    • 对于拥有较多 ID 类特征,或者连续特征离散化,采用了 Embedding Layer,可以参考多任务学习的架构,共享底层 Embedding 参数,仅对上层 DNN 参数独立学习,这样可以利用控制组样本的信息。

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-07

许可协议


网络回响

评论