T-Learner

image.png

  • 训练模型方式 #card

    • 将控制组样本和干预组样本分别用于训练模型 M0M_0M1M_1 (Two,T 的由来),分别学习 M0(X)=E(YT=0,X)M_0(X) = E(Y|T=0,X)M1(X)=E(YT=1,X)M_1(X) = E(Y|T=1,X)
  • 如何预测 #card

    • 在预测时对于同一份样本分别经过 M0M_0M1M_1 ,最终的 CATE 估计为 τ^(x)i=M1(Xi)M0(Xi)\hat{\tau}(x)_i=M_1(X_i)-M_0(X_i)
  • 优点:#card

    • 对干预组 / 控制组样本分别建模,充分考虑了干预变量的影响。
  • 缺点:#card

    • 两个模型训练 bias 不一致,容易有累积误差

    • 干预组样本较少可能导致 M1M_1 过拟合,因此只能降低 M1M_1 的复杂度,这会导致 M1M1M2M_2 存在差异,影响最终的因果效果估计准度。

    • 对于拥有较多 ID 类特征,或者连续特征离散化,采用了 Embedding Layer,可以参考多任务学习的架构,共享底层 Embedding 参数,仅对上层 DNN 参数独立学习,这样可以利用控制组样本的信息。

作者

Ryen Xiang

发布于

2024-10-05

更新于

2025-04-21

许可协议


网络回响

评论