T-Learner
-
训练模型方式 #card
- 将控制组样本和干预组样本分别用于训练模型 和 (Two,T 的由来),分别学习 和 。
-
如何预测 #card
- 在预测时对于同一份样本分别经过 和 ,最终的 CATE 估计为
-
优点:#card
- 对干预组 / 控制组样本分别建模,充分考虑了干预变量的影响。
-
缺点:#card
-
两个模型训练 bias 不一致,容易有累积误差
-
干预组样本较少可能导致 过拟合,因此只能降低 的复杂度,这会导致 和 存在差异,影响最终的因果效果估计准度。
-
对于拥有较多 ID 类特征,或者连续特征离散化,采用了 Embedding Layer,可以参考多任务学习的架构,共享底层 Embedding 参数,仅对上层 DNN 参数独立学习,这样可以利用控制组样本的信息。
-