蔡庆芃 快手高级算法专家
蔡庆芃,清华大学博士,曾任阿里巴巴集团算法专家(阿里星),现任快手高级算法专家,负责快手短视频推荐策略中台组。他的研究兴趣集中在强化学习与推荐系统上,目前在NeurIPS/WWW/AAAI/IJCAI等国际顶级会议上发表论文10余篇,并担任NeurIPS/ICML/ICLR/IJCAI/AAAI/KDD多个会议(高级)审稿人。
所属专题
机器学习性能优化之路
强化学习在快手短视频推荐场景的应用与创新
近年来强化学习在游戏、围棋、机器人等领域取得了重要突破,但是在工业级推荐系统中由于以下挑战还未得到广泛应用:系统不稳定性、动作空间过大、多目标以及延迟奖励问题。本次分享以强化学习在快手短视频推荐系统的技术落地为案例,解读快手基于强化学习进行在线寻参、两阶段约束强化学习算法、如何优化达成APP活跃度。