工业和信息化部主管 中国电子报社主办
收藏本站 投稿

大数据

分布式数据库崭露头角 亟须构建产业生态环境

分布式数据库是传统数据库技术与计算机网络的有机结合,相比于传统的单机或主备模式的集中式数据库,分布式数据库在平滑扩展、高性能、高可靠、高可用、低成本等方面具有优势,特别是在性能方面可突破集中式数据库的瓶颈,具有很强的研究和应用价值,目前很多数据库企业研发了分布式数据库产品,并在金融、电信、互联网等重点行业进行了成功应用,具有良好的发展前景。

互联网及金融领域对分布式数据库需求迫切

分布式数据库最早于20世纪80年代提出,受限于当时的计算机软硬件及网络发展水平,数据库专家M.Tamer Özsu和Patrick Valduriez在经典著作《分布式数据库系统原理(第3版)》中,把分布式数据库定义为一群分布在计算机网络上、逻辑上相互关联的数据库。随着信息技术的发展,集中式数据库也正向基于网络的共享集群路线发展,而市场上的分布式数据库也不仅限于网络分布、逻辑关联等特性,经典的分布式数据库定义显然已不能体现分布式数据库当前技术特点,难以满足数据库种类区分要求。

根据目前我国分布式数据库技术现状,我们认为分布式数据库是具备分布式事务处理能力、可平滑扩展、分布于计算机网络且逻辑上统一的数据库。

相比于集中式数据,分布式数据库具有平滑扩展、高可靠、高可用、低成本等关键特性和显著优点。目前部分分布式数据库实现了分布式事务的强一致性,保证分布式事务的ACID(原子性、一致性、隔离性、持久性)要求,为分布式数据库在关键领域的领域奠定了基础,而且成熟的分布式数据库透明性较好,上层应用系统可以像使用集中式数据库一样使用分布式数据库事务,无需关注分布式数据库的内部细节。

互联网是分布式数据库首先被重点应用的领域。从成本考虑,随着数据量和系统访问量增加,依赖纵向扩展的传统数据库架构,采用小型机、磁阵和商用数据库软件的购买和维护成本会越来越高。而采用廉价PC服务器、使用本地存储的分布式数据库,成本显著下降,同时还带来良好的系统成长性。另外,互联网应用,包括各种大促、春节抢票、秒杀等场景,都有短时间内并发量激增的情形。如果按照业务峰值提前采购计算资源,必然会导致资源浪费。借助分布式数据库的弹性扩缩容的能力,能更好满足业务场景的需求,并避免资源浪费。

金融领域是使用分布式数据库的另一个重要场景,分布式数据库可以满足金融核心领域高安全、高性能、低成本及高质量等要求。目前金融核心业务架构普遍采用“大/小机+Oracle/DB2”集中式数据库系统。一方面随着我国经济和科技,尤其是移动支付的发展,现有系统已无法满足金融类企业高安全、高性能、低成本及高质量等要求;另一方面随着国际形势的变化,现有系统可能会面临服务下降甚至断供的风险。所以逐步以自主可控的分布式数据库替换现有集中式数据库成为金融行业的必然选择之一。

分布式数据库将向云化方向发展

一是分布式数据库的产品化日趋成熟。随着国产分布式数据库在金融、互联网等重点行业中的应用,促使产品技术不断迭代,兼容性、易用性、可扩展性等问题将一一克服。未来随着分布式数据库等的标准体系及评价体系的健全,分布式数据库产品的生态体系也将逐渐完善,在运维保障、数据迁移、运行监测等方面的配套工具也将逐步成熟。

二是与人工智能等新技术融合实现高效运维。在数字经济的推动下,数据的全生命周期管理尤为重要,而分布式数据库数据通常由几十台至数千台服务器组成,数据库的运维显得尤为重要。随着人工智能技术的发展,将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈,是未来发展的必然趋势。另外,在交易、分析和混合负载场景下,可以通过人工智能的学习算法,实现数据库的自动调优。

三是分布式数据库的服务方式将向云化发展。云计算技术已在我国各行业信息化建设中大规模应用,为适应未来信创领域信息化建设技术方向,降低数据库运维成本,灵活调度资源,国内数据库厂商积极布局云数据库产品及服务。阿里云、腾讯云、华为等已经发布了基于自有云平台的云数据库产品,传统数据库厂商达梦也推出云数据库产品。总体上,国内云数据库与国际先进水平基本持平,为未来信创云数据库发展提供良好基础。

大力发展分布式数据库的技术产品

目前,国内绝大部分数据库企业均推出了分布式数据库产品,我国分布式数据库发展基本与国际同步,在一些技术指标和应用层面处于领先水平,而且互联网、金融等领域应用场景对分布式数据库具有切实需求,当前应大力发展分布式数据库的技术产品,加快行业应用,促进数据库产业高质量发展。

首先,政策引导,形成分布式数据库的典型案例。

客观地说,分布式数据库不是传统集中式数据库的更新换代,而是充分结合分布式计算技术,使得在一定规模的节点和付出一定规模的成本后,实现了较高的性能水平,并不是所有的应用场景都适合使用分布式数据库,既没有必要神话分布式数据库的作用,也不应该去贬低其作用。因此我们希望在政产学研用等多方努力下,共同打造分布式数据库的最佳实践,树立一批典型的行业解决方案,并加以宣传推广

其次,产用协同,提升分布式数据库产品成熟度。

分布式数据库作为数据库领域的创新,目前其产品化程度不高,甚至目前的一些所谓分布式数据库产品,其实更像是产品与应用融合后的解决方案,并不利于市场推广。因此我们建议充分利用好数据库以及基础软件领域的创新中心、适配基地及重点实验室等机构,加强供需双方的产用协同,形成良性的问题反馈机制,共同解决一些共性的技术和产品问题,逐步打磨优秀的分布式数据库产品。

最后,营造环境,打造分布式数据库的生态体系。

从产业发展角度来看,相比于集中式数据库,分布式数据库还处于发展的初期,技术体系、标准规范、测评机制、产品推广等方面尚不健全。建议第三方研究和服务机构前牵头,联合推进技术标准、测评认证、迁移验证、示范试点等工作,共同营造良性的分布式数据库生态体系。目前华为、PingCAP等企业发起了分布式数据库的开源社区,并形成了部分商业发行版产品,这可能也是建设分布式数据库生态体系的新思路。

责任编辑:诸玲珍


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2021年全国两会

3月5日,第十三届全国人民代表大会第四次会议在北京人民大会堂开幕。党和国家领导人习近平、李克强、汪洋、王沪宁、赵乐际、韩正、王岐山等出席,栗战书主持大会。初春的北京,处处生机盎然。第十三届全国人民代表大会第四次会议5日上午在人民大会堂开幕。近3000名全国人大代表肩负人民重托出席大会,认真履行宪法和法律赋予的神圣职责。

2021年全国工业和信息化工作会议

12月28-29日,全国工业和信息化工作会议在京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中、五中全会精神,认真落实习近平总书记重要指示批示精神和中央经济工作会议部署,总结2020年工业和信息化工作,分析形势,部署2021年重点工作。工业和信息化部党组书记、部长肖亚庆作工作报告。

2020年中国家电市场报告

3月22日,中国电子信息产业发展研究院发布了《2020年中国家电市场报告》(以下简称《报告》)。《报告》显示,2020年,我国家电市场零售额规模达到8333亿元,在疫情冲击之下显示出较强的韧性;电商渠道对家电零售的贡献率首次超过50%,网络零售对家电消费的促进作用进一步提升;高端产品、生活家电大幅增长,有效促进了消费升级和产业转型。

世界超高清视频(4K/8K)产业发展大会

会议

2020世界显示产业大会

11月20日,由工业和信息化部、安徽省人民政府共同主办的2020世界显示产业大会在合肥市举行。在开幕式上,工业和信息化部部长肖亚庆、韩国驻华大使张夏成发表视频致辞。安徽省委副书记、省长李国英,工业和信息化部副部长王志军出席开幕式并致辞。

2020世界超高清视频(4K/8K)产业发展大会

11月2日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2020世界超高清视频(4K/8K)产业发展大会在广州市召开。广东省委书记李希出席开幕式,省长马兴瑞出席并致辞。国家广播电视总局局长聂辰席、工业和信息化部副部长王志军、中央广播电视总台副台长蒋希伟出席开幕式并致辞。

2020世界VR产业大会云峰会

10月19日—20日,由工业和信息化部、江西省人民政府主办的2020世界VR产业大会云峰会在南昌举行。在10月19日的开幕式上,中共中央政治局委员、国务院副总理刘鹤发来书面致辞。江西省委常委、南昌市委书记吴晓军,工业和信息化部副部长王志军,江西省委书记、省人大常委会主任刘奇先后致辞。开幕式由江西省委副书记、省长易炼红主持。

世界显示产业大会

本周排行