DBMTL模型

本篇博客仅作为学习,如有侵权必删。

https://blog.csdn.net/weixin_48534929/article/details/123404348

DBMTL模型

1. 简单总结:

阿里19年提出的一个多任务模型,该模型显示地建模目标间的贝叶斯网络因果关系。

2. 背景:

目前单任务(如CTR)不能满足工业界推荐算法的需求,还需关注后续的转化链路,如:是否评论、收藏、加购、购买、观看时长等。

常见的多目标转化模型结构:

img

  1. 底层共享参数
  2. 各塔学习自己的目标
  3. 此类网络的概率模型:

img

其中l,m为目标,x为样本特征,H是模型。(各目标独立假设)

3. DBMTL介绍

img

DBMTL与传统MTL结构(认为各目标独立)最主要差别在于构建了目标节点之间的贝叶斯网络,显式建模了目标间可能存在的因果关系。

img

DBMTL模型结构:

img

贝叶斯层对应的损失函数是:

img

不同目标加权后:

img

在网络的贝叶斯层中,函数f1, f2, f3 被实现为全连接的MLP,以学习目标间的隐含因果关系。他们把函数输入变量的embedding级联作为输入,并输入一个表示函数输出变量的embedding。每一个目标的embedding最后再经过一层MLP以输出最终目标的概率。