DLRM

Facebook DLRM框架#card
image.png

image.png

Embedding 层:dense features concat 在一起 经过黄色的 MLP 生成 n 维向量。

NNs:对 embedding 层的结果选择性进行转化

interaction 层:之前的 embedding 两两做点积,并且和 dense features 对应的 embedding concat 输入到 MLP 中。

intercaton 层相当于 [[FM]] 的交叉结果再放到 MLP 中。和 [[NFM]] 有点类似。

最后实验是和 [[DCN]] 对比。

并行训练方法

  • DLRM中的并行拆分#card
    image.png

  • Embedding 层模型并行:解决内存问题,一个计算节点仅保存一部分参数,更新时仅更新自己节点上的参数#card
    image.png

  • MLP 层数据并行:保存全部的参数,利用部分数据计算梯度,再用全局归约的方法汇总所有梯度进行参数更新。#card
    image.png

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-07

许可协议


网络回响

评论