2025-06-072025-06-07 随手记 2 分钟读完 (大约285个字) 0次访问

T-Learner

训练模型方式 #card
- 将控制组样本和干预组样本分别用于训练模型 $M_0$ 和 $M_1$ （Two，T 的由来），分别学习 $M_0(X) = E(Y|T=0,X)$ 和 $M_1(X) = E(Y|T=1,X)$ 。
如何预测 #card
- 在预测时对于同一份样本分别经过 $M_0$ 和 $M_1$ ，最终的 CATE 估计为 $\hat{\tau}(x)_i=M_1(X_i)-M_0(X_i)$
优点：#card
- 对干预组 / 控制组样本分别建模，充分考虑了干预变量的影响。
缺点：#card
- 两个模型训练 bias 不一致，容易有累积误差
- 干预组样本较少可能导致 $M_1$ 过拟合，因此只能降低 $M_1$ 的复杂度，这会导致 $M1$ 和 $M_2$ 存在差异，影响最终的因果效果估计准度。
- 对于拥有较多 ID 类特征，或者连续特征离散化，采用了 Embedding Layer，可以参考多任务学习的架构，共享底层 Embedding 参数，仅对上层 DNN 参数独立学习，这样可以利用控制组样本的信息。

T-Learner

Ryen Xiang

2025-06-07

2025-06-07

网络回响