链接:强化学习在推荐系统中的实践探索与业界进展,张启华,虎牙
链接:淘宝推荐场景的利器:融合复杂目标且支持实时调控的重排模型 如何灵活调节多目标之间的权重。
对应论文:[[KDD/2023]] Controllable Multi-Objective Re-ranking with Policy Hypernetworks
链接:淘宝推荐场景的利器:融合复杂目标且支持实时调控的重排模型 如何灵活调节多目标之间的权重。
对应论文:[[KDD/2023]] Controllable Multi-Objective Re-ranking with Policy Hypernetworks