标签: DataFun - 算法花园

2024-06-142026-02-17 随手记几秒读完 (大约53个字)

@强化学习在推荐系统中的实践探索与业界进展

链接：强化学习在推荐系统中的实践探索与业界进展，张启华，虎牙

web, 强化学习, DataFun

2024-06-092026-02-17 随手记 3 分钟读完 (大约498个字)

@基于超网络的实时可控重排模型

链接：淘宝推荐场景的利器：融合复杂目标且支持实时调控的重排模型如何灵活调节多目标之间的权重。

对应论文：[[2023]] Controllable Multi-Objective Re-ranking with Policy Hypernetworks

web, Alibaba, ReRank, DataFun

2024-06-092026-02-17 随手记 7 分钟读完 (大约1058个字)

@淘宝推荐场景的利器：融合复杂目标且支持实时调控的重排模型

链接：淘宝推荐场景的利器：融合复杂目标且支持实时调控的重排模型，王原博士，淘宝

web, Alibaba, ReRank, DataFun