加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

?专访 | 今日头条2016 Byte Cup大赛实战经验分享:要充分挖掘模

发布时间:2021-01-01 23:28:27 所属栏目:大数据 来源:网络整理
导读:机器之心原创 作者:杜夏德 今日头条技术副总裁杨震原在 2016 Byte Cup 世界机器学习比赛颁奖仪式上说,「我们期望经过算法解决问与答的匹配功率疑问。这个疑问即使是小幅的改善,也会影响到数以百万计的用户。」 近日,由今日头条与中国人工智能学会及 IEEE
副标题[/!--empirenews.page--]

机器之心原创

作者:杜夏德


今日头条技术副总裁杨震原在 2016 Byte Cup 世界机器学习比赛颁奖仪式上说,「我们期望经过算法解决问与答的匹配功率疑问。这个疑问即使是小幅的改善,也会影响到数以百万计的用户。」


近日,由今日头条与中国人工智能学会及 IEEE 中国分会合办的 2016 Byte Cup 世界机器学习比赛颁奖仪式在中国工程院举行。共有 1000 多支队伍参赛,冠亚季军队伍分别是 brickmover、天穹战队和西电战队。

?

本次比赛的任务是建立模型,将头条问答中普通用户的问题更快更好地推送给专家。与以往比赛不同的是,这次比赛所用数据来自于头条问答真实的用户数据。

?

颁奖仪式结束后,机器之心对这三支得胜队伍代表成员进行了独家专访,分享了比赛过程中的心得。他们分别是西电战队的郭正肖和郝磊,天穹队的钱乾与 BrickMover 队的庞亮。

?

学科背景:


庞亮:deep leaning 文本匹配?

郭正肖:计算机图形学

郝磊:通信网络

钱乾:数据挖掘工程

?

首先我们来看看这三支队伍的所用模型和比赛思路

?

第三名西电战队

他们使用的是 FM 算法,并从算法、协同过滤和模型融合三个方面进行考虑。据该队成员介绍,使用 FM 算法有两个考虑,首先是用一系列因变量模型特征之间的关系,更容易发现特征之间的隐藏,适用于解决推荐系统的问题,二是 FM 算法具有线性,时间复杂度低,运行速度较快。在模型融合上,他们选择 FM 算法预测结果协同过滤算法结果经过加权作为最终的结果。

?

?专访 | 今日头条2016 Byte Cup大赛实战经验分享:要充分挖掘模


第二名:天穹战队

?

第二名的选择算法的过程有些曲折。他们首先考虑了 SVD 与 SVD++模型。在验证了 SVD 对这个问题的效果之后,开始尝试用一个比较通用的 FM 算法来处理这个矩阵的分解问题,并在比赛后期为了满足自定义优化需求,重新实现了 fm 并在优化方法上做了修正,使得预测效果得到很大的提升。


?专访 | 今日头条2016 Byte Cup大赛实战经验分享:要充分挖掘模


?第一名:BrickMover

?

他们在比赛的前半段都是在设计一个单模型,提升单模型的效果,后半段利用 Blendling 进行模型融合的。具体过程请看下图:


?专访 | 今日头条2016 Byte Cup大赛实战经验分享:要充分挖掘模

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读