本篇博客仅作为学习,如有侵权必删。
https://blog.csdn.net/weixin_48534929/article/details/123404348
DBMTL模型
1. 简单总结:
阿里19年提出的一个多任务模型,该模型显示地建模目标间的贝叶斯网络因果关系。
2. 背景:
目前单任务(如CTR)不能满足工业界推荐算法的需求,还需关注后续的转化链路,如:是否评论、收藏、加购、购买、观看时长等。
常见的多目标转化模型结构:
- 底层共享参数
- 各塔学习自己的目标
- 此类网络的概率模型:
其中l,m为目标,x为样本特征,H是模型。(各目标独立假设)
3. DBMTL介绍
DBMTL与传统MTL结构(认为各目标独立)最主要差别在于构建了目标节点之间的贝叶斯网络,显式建模了目标间可能存在的因果关系。
DBMTL模型结构:
贝叶斯层对应的损失函数是:
不同目标加权后:
在网络的贝叶斯层中,函数f1, f2, f3 被实现为全连接的MLP,以学习目标间的隐含因果关系。他们把函数输入变量的embedding级联作为输入,并输入一个表示函数输出变量的embedding。每一个目标的embedding最后再经过一层MLP以输出最终目标的概率。