DeepFM
特征处理
- 连续特征不做 embedding,进入二阶交
为什么 Deep 和 FM 共享一份 embedding #card
-
内存增大,过多参数可能导致过拟合
-
如果特征不同,同一个 token 可能训练量不一样
与 [[Wide&Deep]] 对比 #card
-
wide 部分引入 FM 自动特征组合能力,避免原来浅层部分人工特征工程
-
fm 和 deep 共享原始输入特征,保证模型特征的准确与一致。
FM Layer 的直接与输出单元连接,DNN 部分,加强浅层网络部分特征组合的能力。
DNN与DeepFM之间的区别? #card
- DNN是DeepFM中的一个部分,DeepFM多一次特征,多一个FM层的二次交叉特征
[[Ref]]
-
推荐算法注意点和DeepFM工程化实现 - 知乎 混沌大学课程推荐
-
样本
-
样本冲突:相同推荐结果,用户选择前后矛盾。只保留正样本
-
样本下采样:样本集合倾向于高频时间段
-
数据穿越
-
特征数据在样本发生之后
-
线上预测特征延迟
-
-
-
特征稀疏、一列多值、权重共享
-
重排序:相同老师的课程不相邻出现。[[多路线]]
-