加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

视觉信息助力广告点击率预估--京东广告团队技术论文入围KDD2020

发布时间:2020-06-24 03:26:50 所属栏目:业界 来源:站长网
导读:副标题#e# 在以AI技术为支持的推荐、搜索、广告等业务中,点击率预估(CTR)一直是技术攻坚的核心,同时也是AI技术在业务落地中最难实现的技术方向之一。近日,来自京东广告团队的一篇论文《Category-Specific CNN for Visual-aware CTR Prediction at JD.com
副标题[/!--empirenews.page--]

在以AI技术为支持的推荐、搜索、广告等业务中,点击率预估(CTR)一直是技术攻坚的核心,同时也是AI技术在业务落地中最难实现的技术方向之一。近日,来自京东广告团队的一篇论文《Category-Specific CNN for Visual-aware CTR Prediction at JD.com》,即《在京东,视觉助力点击率预估——基于给定类目信息的卷积神经网络》被KDD2020成功收录。论文构建了一种基于特定类目的卷积神经网络(Category-Specific CNN, CSCNN),该算法有效利用了电商领域中丰富的商品类目信息,创新性的将商品类目信息与商品主图共同作为主图特征提取模块的输入,提取基于特定先验类目信息的商品主图特征,大大提高了CTR预估的准确度。

尽管京东的广告业务在业界起步的比较晚,但增速却让人刮目相看。这其中很大一部分原因得益于AI技术在广告业务的大范围应用。据京东商业提升事业部广告质量部负责人包勇军介绍,京东机器学习在2015年正式应用在在线广告中,初版排序模型使用浅层FM base的超稀疏模型,浅层模型时代的模型工作,主要着眼在业务理解和特征提取。这为以后模型发展技术路线奠定了一定的迭代基础,相对于当时许多tree base model架构的业务线,京东更容易向神经网络迁移。在2016年,商业提升事业部部署LR-DNN模型架构,基于Theano框架离线训练,自研在线severing服务。模型上线早于google的wide & deep模型发布,虽然较w&d模型设计和使用略显粗糙,但是也是将深度学习算法引入广告生产环境中的一次大版本升级,对于部门有举足轻重的意义。2017年,商业提升事业部的算法部门将整个模型基础架构进行升级,9N机器学习平台进行内功修炼,内核迁移到工业界主流的TensorFlow平台,完善作为工业生产平台的所有配套模块。

2018年后,模型算法进入业务建模时代,算法升级从特征加工、模型调参,迈向业务理解建模的新阶段。模型迭代升级进入快车道,业务指标显著增长。模型建模出现新的细分方向,同时,模型建模迭代也推动自研机器学习平台9N的升级。京东将精力更多的放在用户刻画、预估商品刻画、用户和商品关系的建模上,同时致力于发现模型应用中的使用短板,解决模型规模、学习效率、参数更新实时性等关键技术问题:

image.png

l Multi task DCN主要解决了两个问题。首先将LR-DNN升级到DCN,将算法工程师从特征选择交叉的繁重工作中解放。其次采用多路输出的模型解决position bias。

l User Memory Net静态用户刻画。长期行为更致力于刻画用户内在属性和偏好,并可以排除由外界因素导致的用户短期兴趣波动。由于使用了很长的用户行为,在线serving架构设计存在难点。

l Category Specific CNN (CSCNN)是一种使用CNN抽取图像信息,并和CTR任务端到端联合优化的建模方法。一方面,需要考量高效离线训练及线上serving的方法。另一方面,和传统只以图片为输入的CNN不同,CSCNN将电商场景下丰富、具有强视觉先验的“商品类目标注”作为CNN输入的一部分,降低CNN训练的难度。CSCNN可以从商品图中提取到标题/类目等特征刻画不出的细节,并对冷启商品有更好的泛化。

l KFAtt(KF Attention model for user behavior sequence)是用户实时行为序列建模的方法。整体我们采用Transformer的框架建模时序及用户行为和当前target的关联,是综合考量线上serving和后期迭代的扩展性的技术选型,实验验证效果优于流行的DIN和DIEN。我们进一步指出传统attention存在的问题,并直接对attention机制做出了改进。在用户兴趣多变、异质行为差异巨大电商场景下,KFAtt比传统attention表现出更优的效果。

l Realtime Graph Convolutional Network (RGCN)是用户-商品实时关系图建模的方法。对于长尾和冷起阶段的商品,借助关系图可以得到更丰富的表示;对于活动、促销,实时关系图也可以更快捕获商品的时变特性。

目前机器学习已经在京东广告的各个环节得到深入应用。后续我们会逐一为大家进行详细介绍。此次入围KDD的论文,就是机器学习在广告CTR模型生产环境中结合图像信息的CTR建模的应用,接下来让我们一起详细了解一下这篇论文

一、任务背景:

广告点击率(Click Through Rate, CTR)预测问题,即已知用户、广告、环境等信息,预测该用户点击该广告的概率,是广告领域的最根本问题之一。精准的广告点击率预测是整个广告系统的基石,直接关系到京东数亿活跃用户的使用体验与百万广告主的切身商业利益。

在电商领域中,商品普遍以商品主图搭配文字描述的格式展示给消费者。相比于文字描述,商品主图往往包含更多的细节的、直观的商品信息,具有更强的视觉冲击力,直接影响用户偏好。因此,提取商品主图中的丰富的视觉特征,能有效挖掘商品特性,从而为CTR预测提供强有力的支持。

image.png

图一、电商广告示意图,红框内为商品主图。因其占面积大、表达的信息多和更吸引的用户注意力,故其特征的有效提取,对于后续CTR预测,有着至关重要的作用。

我们的目标是:在百亿规模的训练样本上,构建一种CNN有效抽取视觉特征,并和CTR任务联合训练。与此同时,满足线上系统的平响要求。

二、现有方法的问题:

引入视觉信息的CTR预估中,业界通常会采用一种后融合的方式。做法是:采用现成、经典的CNN结构(Inception[1], ResNet[2], SeNet[3] 等)抽取图片特征,并与其他非视觉特征(如广告商品的类目信息、用户的个人特征、广告位置时间等)以后融合的方式,一起作为CTR预估模型的输入。

image.png

图二、现有的商品主图特征提取技术的缺点,红色虚线框为现有技术缺失部分。主图特征提取模块缺失了商品类目作为CNN的输入,无法精确地提取基于特定商品类目的主图特征,限制了CTR预估的准确性。

然而这种业界通用的做法,一直面临两个重要的问题:

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读