加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

星光不问赶路人,看阿里自研数据库崛起之路

发布时间:2019-12-04 08:09:15 所属栏目:业界 来源:站长网
导读:副标题#e# 至顶网软件与服务频道消息: 2019年的双十一已经落下帷幕。天猫双十一实时成交额再创新高,达到2684亿元人民币。阿里旗下的两款自研数据库POLARDB和OceanBase表现也非常优秀,POLARDB最高峰TPS达到8700万次/秒,OceanBase达到6100万次/秒,创下数
副标题[/!--empirenews.page--]

至顶网软件与服务频道消息: 2019年的“双十一”已经落下帷幕。天猫“双十一”实时成交额再创新高,达到2684亿元人民币。阿里旗下的两款自研数据库POLARDB和OceanBase表现也非常优秀,POLARDB最高峰TPS达到8700万次/秒,OceanBase达到6100万次/秒,创下数据库的新记录。抗住如此大并发流量的压力,充分证明这两个数据库的可靠性与稳定值得信赖。

应该说,这一切并不令人意外,今年10月份阿里自研数据库已经给了我们一次大大的惊喜,OceanBase刷新了甲骨文在TPC-C排行榜保持9年第一的记录,完成了登顶。同样,POLARDB在与同类竞争对手的对比中,也表现亮眼。在Gartner公布的2019年全球数据库魔力象限评选中,作为国内数据库市场份额第一的厂商,阿里云成功进入“挑战者”象限,连续两年作为唯一中国企业入选。在Forrester发布的数据库评估报告《The Forrester Wave:Database-As-A-Service,Q2 2019》中,阿里云数据库也跻身“强劲表现者”阵营。

 星光不问赶路人,看阿里自研数据库崛起之路

众所周知,在数据库领域从来都是甲骨文(Oracle)、IBM(DB2)、微软(SQL Server)等国外巨头的天下,垄断市场超过30年,此前中国的数据库从来没有在Gartner的魔力象限上出现过。虽然这些年我们从来没有放弃过研发自己的数据库的努力,但在市场上几乎感受不到国产数据库的存在。一直等到阿里POLAREDB和OceanBase,中国的数据库才终于有了自己的一席之地,实属难得。

回头看阿里云数据库的这一段历史,一路走来历经波折,非常不易,但在阿里技术人员的坚持和阿里高层坚定不移的支持下,终于迎来了今天的成绩,为中国人在科技领域赢得了荣誉。这一段历史不仅值得阿里人记忆同时也值得中国IT人好好铭记和回味。

2009年的那一场行动

2009年,在阿里巴巴的发展历史上绝对是值得大书一笔的一年。这一年,阿里云的飞天操作系统写下了第一行代码,它揭开了中国云计算产业的新篇章,也是在这一年,阿里集团启动了去“IOE”行动,此举同样给阿里乃至整个中国的IT行业带来深远影响。

“IOE”三个字母分别代表IBM、 Oracle和 EMC 。当时IBM的小型机、Oracle的数据库、EMC的存储是企业IT系统的主要担当,它们代表了稳定、可靠,但是价格昂贵。去“IOE”就是用开放、便宜、通用设备来取代这些封闭、昂贵的专用设备。

那些年,随着阿里巴巴业务(当时主要有B2B网站、淘宝、支付宝)的快速扩张,每年新采购设备费用和旧系统的维护费越来越大,更为重要的是,这些设备和系统就像一个个黑盒子,一旦出现故障必须等待厂商的技术人员来解决。花了那么多钱,还被人“卡着脖子”这是阿里巴巴所不能接受的。2009年,忍无可忍的阿里人决定把命运掌握在自己手里,这才有了去“IOE”。

在“IOE”中最难去的就是“O”,也就是Oracle数据库。因为Oracle数据库中保存的是企业最核心和最宝贵的资产——数据。更换数据库不仅意味着要面临数据迁移时损坏和丢失的风险,还意味着上层软件代码重写。更为要命的是,Oracle数据库是当时技术最先进的数据库,如果Oracle不行,哪个数据库行?在2009年,阿里 Oracle RAC 集群节点数达到了创记录的20个,成为亚洲第一,这样的数据量换到哪个数据库能抗得住?

没有其他选择的阿里对开源数据库MySQL进行修改以满足淘宝的业务需要,这就是今天的AliSQL的雏形,后来发现这并不能彻底解决阿里面临的挑战,不得不启动了数据库的自研之路,这才有了今天的POLARDB和OceanBase。

阿里去“IOE”的过程历时超过3年,一直到2011年7月,淘宝商品库完成了从 Oracle 到 AliSQL 的大迁移,2012年全淘宝最后一台小型机宣布下线,阿里的去“IOE”取得初步成功。2013年支付宝最后一台小型机下线,这也是阿里巴巴全集团最后一台小型机下线,阿里历时三年多的去“IOE”基本告一段落。在此过程中阿里自研数据库功不可没。

POLARDB:为云而生

当年阿里决定“去IOE”时,市场上除了Oracle外其实没有哪个数据库能满足淘宝的业务要求,最后换成MySQL是不得已。MySQL是使用最广泛的开源数据库,最重要的是阿里可以拿到源代码,这样就可以按照自己的应用场景对代码进行修改和改进。

阿里技术人员对MySQL数据库按照自己的业务要求进行了修改和改进,增加了不少原来没有的功能,AliSQL由此诞生。到2013年,阿里的“双十一”就已经完全靠AliSQL来支撑了,但是每一年阿里的“双十一”交易量都会有比较大的增长。尤其是每年“双十一”零点的峰值来得越来越猛烈,而且几乎是瞬间上去的(今年“双十一”数据库压力达到了正常值122倍),一直要持续10分钟,再开始逐步递减。这种高峰时的高并发流量是对数据库的最大考验。

“每年双十一零点开始的10分钟,是我们压力最大的时候,我们会紧张地盯着压力曲线,看看会不会抖,因为一抖就是数据库出现了问题,只要过完这惊心动魄的十分钟,我们就基本可以放心了。”阿里云智能数据库产品事业部技术专家曹伟(花名:鸣嵩)表示。

面对每年双十一不断攀升的压力,眼看AliSQL数据库很快就接近能力极限。2015年阿里云决定研发自己的数据库,两年后的2017年10月份,阿里云宣布推出POLARDB,开始公测,2018年4月POLARDB正式对外商用。

阿里云的POLARDB是真正为云而生的数据库,采用的是分布式共享存储架构,计算与存储分离,带来数据库的高可扩展性。由于计算与存储的解耦,存储可以通过RDMA高速网络形成分布式存储。正是由于采用了计算与存储分离的架构设计使得POLARDB的最大数据容量可以达到100TB,并发量也达到了MySQL的10倍以上。除了借助RDMA等网络技术实现弹性伸缩能力之外,POLARDB还享受了很多现代技术的红利。比如,POLARDB采用了傲腾内存、GPU等等,从而带来更好的性能表现。

谈到POALRDB的特点,曹伟总结为三点:创新、开放和普惠。所谓创新是指POLARDB利用其诞生于云时代的后发优势大量采用了创新技术,如上所述的存储与计算分离、RDMA等。开放是指POLARDB充分兼容传统数据库包括Oracle、MySQL的生态,让MySQL、Oracle数据库能一键迁移到POLARDB。成本是指POLARDB成本不到传统数据库的1/6,能让用户以更低成本享受到很大的容量、更高的TPS、很好的生态。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读