加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

中台四杰与阿里往事

发布时间:2019-12-21 02:40:20 所属栏目:站长百科 来源:站长网
导读:(讯)1 2014年,阿里西溪园区的一间会议室里,一群全世界最优秀的数据工程师陷入了激烈的争吵。他们慷慨陈词,争得面红耳赤,谁也说服不了谁。这种场面在长达近一年的时间里反复上演,所有置身其中的人都感到前所未有的痛苦和迷茫。 追溯这段争吵的根源,需
副标题[/!--empirenews.page--]

(讯)1

2014年,阿里西溪园区的一间会议室里,一群全世界最优秀的数据工程师陷入了激烈的争吵。他们慷慨陈词,争得面红耳赤,谁也说服不了谁。这种场面在长达近一年的时间里反复上演,所有置身其中的人都感到前所未有的痛苦和迷茫。

追溯这段争吵的根源,需要把时间的指针拨回到两年前。

2012年7月10日,阿里对外公布了一项人事变动:集团将设立首席数据官(CDO)岗位,由陆兆禧担任,直接向马云汇报。在不少人看来,这其实是陆兆禧接任集团CEO的前奏。

坊间有这样的猜测并不奇怪,因为阿里素来是一家重视数据的公司,首席数据官这个角色的重要性不言而喻。况且,集团不久前刚刚提出了“one company”战略。

2012年正是阿里历史上著名的“万马奔腾”时期,支付宝、淘宝、阿里金融、B2B等几大子公司齐头并进。当时每个子公司都有一个自己的数据部门,随着数据量暴涨,这种“各家自扫门前雪”的模式不但在成本效益上不划算,也无法让各个子公司发挥协同效应,产生更大的合力。“one company”战略正是在这样的背景下提出的。

这个战略的核心是在阿里集团内部建设一个“数据分享平台”,支付宝、淘宝、阿里金融、B2B等几家子公司的数据都将成为这个平台的一部分,经过挖掘、分析和运用后,分享给全社会。毫不夸张地说,这是阿里历史上的一次百年大计,而负责推动这项战略的正是新任CDO陆兆禧。这份担子有多重,明眼人都看得出来。

本着“one company”的原则,陆兆禧上任后做的第一件大事就是将各个子公司与数据平台相关的部门合并,成立了统一的数据平台事业部。随着数据平台事业部成立,几百名阿里最优秀的数据工程师第一次走到了一起。当然,也有人是久别重逢,比如张金银(花名“行在”)和陈吉平(花名“拖雷”)。

2

张金银和陈吉平最早是在“百年阿里”培训班上认识的,两人都在2004年5月以专家身份入职阿里。

阿里的传统是,新员工入职时要和当月入职的新人一起参加为期两个星期的脱产培训——也就是“百年阿里”培训班,学习阿里的企业制度、组织文化和未来愿景。张金银和陈吉平那一期培训班大概有20人,两个星期相处下来大家都比较熟络,他们亲切地称呼彼此为“同班同学”。

回忆起那段岁月张金银不无感激。因为放在2004年的时代背景下,阿里这样一家刚成立5年的创业公司,愿意如此花大力气在员工身上做投入,可谓十分超前。

培训班结束后,张金银去了阿里巴巴(今天的B2B事业部),负责首个数据仓库的建设,2009年又担任了阿里巴巴集团第一任数据安全小组组长,拥有不错的职业开端。

入职淘宝的陈吉平际遇则要更加坎坷一些。当时B2B业务是公司的绝对核心(2007年11月曾在香港独立上市),而淘宝还只是一个项目组,根本无法相提并论。

陈吉平至今依然记得自己刚去淘宝时的情形,“在二楼一个不大的办公室里,人不多,办公环境乱糟糟的,服务器就在办公室后面,发出嗡嗡的响声。”

尽管陈吉平也参与建设了淘宝的首个数据仓库,但囿于淘宝当时的地位,给外人的感觉还是要矮上一头。

这种情况直到2008年前后才发生变化,那一年淘宝的业务和数据量迎来了爆发式增长。作为To C业务,一旦迈过爆发的临界点,其释放出的能量自然是To B业务所无法比拟的。因此,之后阿里遇到的很多技术挑战都来自于淘宝业务线,淘宝技术团队的地位随之水涨船高,而陈吉平也迎来了自己职业生涯的高光时刻。

当时淘宝的数据仓库还建在Oracle RAC上,陈吉平记得,因为淘宝的数据量增长实在太快了,而单个节点的存储能力又有限,他们只能不停地扩节点。“扩到了20个节点还是跑不动,可这已经是亚洲最大的Oracle RAC集群了……而且当时亚马逊建了一个最大的Oracle集群,也只有20个节点”。

外界可能无法理解这件事情的重要性,但它却惊动了Oracle美国总部。陈吉平还因此受邀去OOW会议做了一次案例分享。

中台四杰与阿里往事

拖雷在美国OOW会议上

这件事也直接推动了阿里的去IOE化。阿里内部当时算过一笔账,如果继续沿用IOE架构,未来几年它的营收可能还赶不上服务器费用的支出。也就是说,如果不去IOE化,阿里很有可能会被数据给拖垮。

3

2012年,在“one company”的战略大方向下,阿里以淘宝的后台技术部门为主体,合并其他事业部的后台技术团队,成立了数据平台事业部,由当时淘宝数据团队的老大汪海(花名“七公”)出任负责人。

随着数据平台事业部成立,张金银和陈吉平殊途同归,又重新回到了同一起跑线。一同并入数据平台事业部的还有甘云锋(花名“风剑”)和李金波(花名“介然”)。

李金波是2008年进入阿里的,最早在淘宝的广告事业部负责广告数据研发工作。2012年初,阿里启动“冰火鸟”项目,计划把由李金波负责数据研发的“数据魔方”(2015年底由“生意参谋”接替)产品迁移至阿里云飞天平台,实现淘宝数据的对外开放。

为了顺利完成这一任务,李金波和另外两支团队“被关在小黑屋里”进行了长达大半年的技术攻关。2012年10月,“冰火鸟”项目一期正式上线。几乎同一时间,数据平台事业部成立,李金波随之和张金银、甘云锋一起被分配到了数据平台事业部下面的DXP团队。

当时李金波所在的团队主要负责将淘宝、天猫、B2B等各个事业部的数据进行整合打通,最终反哺到各个事业部。正是在那时候,阿里提出了“存通用”的概念。

李金波记得,数据平台事业部成立的第一年,日子过的非常艰苦。因为当时用的阿里云平台还很不稳定,经常导致数据加工链路失败,容易对上游各事业部的业务造成影响。为此,他们挨了业务部门不少骂,包括汪海在内的许多人都承受了巨大的压力。为了解决数据产出稳定性的问题,团队专门抽调了一批技术人员进行夜间值班,这些值班人员有一个统一的名字“batman”。“正是因为这些蝙蝠侠的努力,才保障了整个集团对数据的应用”。回忆起那段岁月,李金波感慨地说道。

甘云锋是四个人中最晚进入阿里的,此前他曾长期任职于华为、金蝶等多家国际知名企业,从事数据开发相关的工作,也是大数据领域一名身经百战的老兵。2011年,甘云锋在张金银的招募下进入阿里,成为了接下来几年时间里后者最可靠和得力的搭档。

让张金银、甘云锋、陈吉平和李金波四个人走到一起的数据平台事业部,后来在技术上取得了巨大成功。部门成立仅仅两年时间,就为阿里贡献了两项非常重要的基础设施:第一项基础设施是由现在被誉为“阿里人工智能客服‘小蜜’之父”的赵昆(花名“空无”)带队攻关的5K项目;第二项是张金银主导创建的消费者信息库TCIF。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读