工业和信息化部主管 中国电子报社主办
收藏本站 投稿

信息通信

达摩院数据库首席科学家李飞飞:阿里巴巴靠什么扛住“双11”122倍的数据洪峰?

开源数据库成为一种改变数据库“游戏规则”的尝试。近年来,谷歌、苹果等企业也在开源数据库领域积极布局。而由云厂商主导的云原生数据库将这种“改变”推向了高潮。6月28日,Gartner发布的全球云数据库市场份额榜单中,阿里云位居第三,成为游戏规则的重要改变者和全球云数据库领跑者之一。7月4日,阿里云智能数据库事业部负责人、达摩院数据库首席科学家李飞飞在接受《中国电子报》记者专访时表示,阿里云高度重视开源数据库的发展,云原生数据库PolarDB等产品对开源社区具有重要贡献。

多年实战经验催生自研 阿里云数据库技术领跑全球市场

记者:阿里云数据库近两年已进入世界各大研究机构榜单的前列,请问你是如何看待阿里云数据库在国际市场定位的?

李飞飞:从Gartner发布的全球云数据库的市场份额榜单来看,阿里云已经位列第三,超越了Oracle、IBM和谷歌。当然,在整个数据库市场中,Oracle、SQL Server依然占有很大市场份额。从技术角度来看,阿里云数据库技术不仅运用到阿里自身的产品中,还在SIGMOD、ICDE、VLDB等国际顶尖数据库技术交流会议上发表技术宣讲,侧面证明了阿里云数据库与国际知名云数据库亚马逊AWS、微软SQL Server站到了同一高度。

记者:阿里云为何自研云原生数据库PolarDB,未来将有怎样的技术布局?

李飞飞:随着移动互联网、物联网的发展,数据量剧增。企业上云也成大势所趋。企业上云意愿达84%,对数据库提出了更高的扩展性和可用性要求。传统商业数据库因昂贵、扩展性差、技术复杂、迭代慢饱受诟病。相反,云原生数据库天然拥有云计算的弹性能力,兼具开源数据库的易用、开放特点,及传统数据库的管理和处理性能优势,是云时代下企业数据库的最佳选择。

在全球范围内,一场替换传统数据库的行动正在进行。早在2013年,阿里巴巴就将最后一台Oracle数据库从其淘宝核心系统中下线,开始使用成本、灵活度、安全、技术进化层面都更具优势的云原生数据库在。

不同于传统数据库的单节点和计算、存储绑定式架构,PolarDB具有显著运行优势。首先,PolarDB能实现计算与存储分离。满足公有云环境下用户业务弹性扩展的刚性需求。数据库的计算节点(DB Server)仅存储元数据,而将数据文件、Redo Log等存储于远端的存储节点(Chunk Server)。其次,PolarDB采用分布式共享存储,大幅提升了数据库的存储容量和数据吞吐量,避免了分布式事务处理等复杂技术。稳定、可靠是数据库运行的核心要求,分布式存储架构巧妙解决了分布式事务处理等技术难题。此外,PolarDB还具有分钟级备份恢复、秒级弹性扩容能力,充分兼容MySQL、Oracle、PostgreSQL等,基于raft一致性协议的实现,提供了金融级数据库高可用服务能力。

客观来讲,PolarDB的架构也还有改进空间。由于分布式共享存储需要利用RDMA远程快速访问网络来实现,这就导致该网络能够连接的节点存在数量上限,在承受巨大并发量时会出现一些问题。

当前,阿里云致力于研发出性能更加强劲的云数据库,来更好地解决这个问题。目前,升级版POLARDB-X已经能出色解决双11等数据洪峰,应对0点0分0秒到0点0分1秒的122倍的数据库负载。

完善后的分布式共享存储架构可实现多写多读,更好地支持大体量、集中化的事务处理,实现跨节点查询,事务处理的复杂程度大幅降低。然而,将“写”集中在同一个节点上,TPS性能可能会因此受限。因此, “多写”可轻松实现每一个节点的写和读,彻底解决任何应用的水平拓展、高并发的任务需求。

赋能新兴信息技术应用 看好中国开源社区生态

记者:开源技术对人工智能、大数据、云计算、自动驾驶的发展有何推动作用?


李飞飞:当前,人工智能、大数据、自动驾驶等新兴技术和系统已经发展到了非常复杂的程度,如果没有开源生态的加持,我很难想象这些新兴技术能发展到今天的高度。

首先,从供给侧角度来看,开源式数据库的体系架构较封闭式的数据库系统能吸引更多有才华的开发者。参与的人越多,思维碰撞而引发的迭代演进就会越快。对于人工智能、大数据、自动驾驶这些极其复杂的新兴技术和系统来讲,任何一家闭源数据库公司的资源和开发力量都相对有限,技术需要越来越多的开源人才贡献力量。

从需求侧角度来看,各个企业在使用开源系统做人工智能、大数据的技术支撑时,不仅可以免除被闭源系统的技术绑定,还可以在开源社区实现数据库技术迁移,企业也可针对企业技术特征进行数据库的个性定制化,实现大量的应用和代码改造且系统间互相兼容。

记者:当前中国的开源社区生态如何?你是否看好PostgreSQL在中国的发展?

李飞飞:目前,MySQL在中国的开源数据库领域占主导地位,其次是PostgreSQL,但后者体量无法与前者相比。但PostgreSQL的市场潜力巨大。PostgreSQL在国际市场的增速较快,尤其是在东南亚国家中,PostgreSQL已经逐渐占领主导地位。从国内市场来看,PostgreSQL将有更多机会,为我国整个开源社区带来增长。

这其中有一个有趣的插曲:MySQL是主流的开源软件架构,但其被Oracle收购。这带来了两方面的风险,一是Oracle将控制MySQL的竞争力,防止MySQL对其超越的可能性;二是Oracle会随时修改MySQL的开源协议,对使用条款设置门槛,导致在MySQL成为一个相对封闭的开源架构。

PostgreSQL的开源协议相对友好,不受任何一家公司的决策局限,社区“民主自由”,有利于中国基于PostgreSQL发展自己的生态、贡献智慧。此外,较MySQL而言,PostgreSQL对Oracle的兼容性更好,这就对传统的线下市场、大量Oracle的存量用户重大利好,为数据库大量迁移带来便利。

在未来,希望PostgreSQL继续保持高可用、代码友好、开放态势,吸引更多软件人才贡献开源社区,同时也能获利更多企业用户。

责任编辑:马利亚


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2021年全国两会

3月5日,第十三届全国人民代表大会第四次会议在北京人民大会堂开幕。党和国家领导人习近平、李克强、汪洋、王沪宁、赵乐际、韩正、王岐山等出席,栗战书主持大会。初春的北京,处处生机盎然。第十三届全国人民代表大会第四次会议5日上午在人民大会堂开幕。近3000名全国人大代表肩负人民重托出席大会,认真履行宪法和法律赋予的神圣职责。

2021年全国工业和信息化工作会议

12月28-29日,全国工业和信息化工作会议在京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中、五中全会精神,认真落实习近平总书记重要指示批示精神和中央经济工作会议部署,总结2020年工业和信息化工作,分析形势,部署2021年重点工作。工业和信息化部党组书记、部长肖亚庆作工作报告。

2020年中国家电市场报告

3月22日,中国电子信息产业发展研究院发布了《2020年中国家电市场报告》(以下简称《报告》)。《报告》显示,2020年,我国家电市场零售额规模达到8333亿元,在疫情冲击之下显示出较强的韧性;电商渠道对家电零售的贡献率首次超过50%,网络零售对家电消费的促进作用进一步提升;高端产品、生活家电大幅增长,有效促进了消费升级和产业转型。

世界超高清视频(4K/8K)产业发展大会

会议

2020世界显示产业大会

11月20日,由工业和信息化部、安徽省人民政府共同主办的2020世界显示产业大会在合肥市举行。在开幕式上,工业和信息化部部长肖亚庆、韩国驻华大使张夏成发表视频致辞。安徽省委副书记、省长李国英,工业和信息化部副部长王志军出席开幕式并致辞。

2020世界超高清视频(4K/8K)产业发展大会

11月2日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2020世界超高清视频(4K/8K)产业发展大会在广州市召开。广东省委书记李希出席开幕式,省长马兴瑞出席并致辞。国家广播电视总局局长聂辰席、工业和信息化部副部长王志军、中央广播电视总台副台长蒋希伟出席开幕式并致辞。

2020世界VR产业大会云峰会

10月19日—20日,由工业和信息化部、江西省人民政府主办的2020世界VR产业大会云峰会在南昌举行。在10月19日的开幕式上,中共中央政治局委员、国务院副总理刘鹤发来书面致辞。江西省委常委、南昌市委书记吴晓军,工业和信息化部副部长王志军,江西省委书记、省人大常委会主任刘奇先后致辞。开幕式由江西省委副书记、省长易炼红主持。

世界显示产业大会

本周排行