中国科技2020|大数据背后的大国较量 Oracle技术霸权被谁破局

撰写:
最后更新日期:
撰写:
最后更新日期:

2020年年终的中共中央经济工作会议上,中国政府为2021年发展重点部署八大任务。这场中共高层官员的工作会议,不仅将“强化国家战略科技力量”列为下一年经济发展首要任务,且坦言要通过举国体制优势发展高科技,“尽快解决一批‘卡脖子’问题”。显然,在高科技领域的全球竞争中,中国要提高自己的话语权。回看2020年,中国在探月工程、火星探测、卫星导航、载人深潜、量子研究、数据库技术替代、核聚变技术国际参与以及中微子实验和芯片制造等领域,均有亮眼表现或国家战略部署。这些领域的科技研究,对应着怎样的现实意义?中国的竞争优势和现实挑战格局如何?下一步的发展方向又在哪里?

中国数字经济总量规模和增长速度位居世界前列,2019年数字经济规模达占GDP比重达36.2%。图为第二届数字中国建设成果展览会现场。(视觉中国)

相对于华为停供引发舆论对中国芯片制造技术的高度忧虑和关注相比,数据库管理系统(DBMS)是容易被忽略实际上却非常重要的技术。简单来说,今天人人知道的大数据就和数据库技术息息相关,甚至可以说没有数据库就没有国计民生。对于今天的中国来说,无论是要在中美竞争中打破美国的科技围堵,还是中国自身要全面推进数字经济转型升级,数据库技术的突破都显得关键且迫切。

11月30日,2020年中国联通科技创新大会上,中国科学院大学公管学院副院长、中国科学与科技政策研究会常务理事教授刘云,再次列举了中国被美国“卡脖子”的35项关键技术。比如光刻机,芯片,操作系统,手机射频器件,激光雷达,核心工业软件等。业内人士普遍认为,在数据库领域,中国开发的分布式数据库已登上历史舞台,35项“卡脖子”技术清单已经可以划掉一项。

这一场承载着中国大数据急速发展的技术破局战背后,是中国数据库软件开发人员30年的蛰伏与“十年磨一剑”的破局之旅。

狂傲甲骨文迎来命中拐点

既然是破局,必然就说明在中国在自己的数据库架构雏形出现之前,已经存在一个近乎霸主地位的平台,那就是IT行业众人皆知的数据库龙头企业甲骨文(Oracle)公司。成立于1977年的Oracle是仅次于微软(Microsoft)的全球第二大软件公司,其核心产品是关系型数据库软件,市场占有率多年来排名全球第一。到2010年,Oracle仍然控制着全球超过50%的数据库,可谓是数据库里的“印钞机”。

2010年,Oracle在TPC-C测试中跑出3,024万tpmC(tpm为transactions per minute的缩写,tpmC意思为"每分钟内系统处理的新订单个数",被广泛用于衡量计算机系统的事务处理能力)的成绩,是一起参与测试的国际商业机器公司(IBM)的3倍。此后,被吊打的IBM再无还手之力,而孤独求败的Oracle不再参与成本高昂的TPC-C测试。

如此态势之下,挑战Oracle似乎是以卵击石。但是机会很快出现。21世纪第一个十年,随着淘宝网(Taobao)的电商业务席卷中国大地并很快超越美国在线购物网站eBay,不断井喷的用户数据不仅让淘宝所在的阿里巴巴(Alibaba,简称阿里)集团成为Oracle最大的亚洲客户,也挑战着Oracle数据库的能力极限。据说,从2007年到2009年的三年间,阿里花了几千万人民币(1元人民币约合0.15美元)买 Oracle 产品+服务也没办法支撑数据成长的速度。

+3
+2

古希腊历史学家希罗多德(Herodotus)曾说“上帝欲使人灭亡,必先使其疯狂”(Those whom God wishes to destroy, he first makes mad)。北京时间2010年11月11日23时59分30秒,第二个淘宝“双11”就要结束,支付宝核心账务系统突然报警——数据库资源即将耗尽。技术人员砍掉最后一个非关键应用的时候,距离整个系统崩溃只剩下4秒。

不仅是Oracle的集中式数据库架构跟不上狂飙猛进的中国大数据发展,其成本高昂的标准配置(Oracle的标配是IBM小型机和EMC的高端存储硬件)也让一般用户难以承受。2009年底,负责淘宝技术预算的刘振飞给领导层的PPT报告最后以惊叹号结尾,粗体写上一句:“淘宝2010年起不再购买小型机了!” 当时的预算结果显示,随着用户数据的井喷式增长,未来为了满足需求的采购费用已经接近甚至超过全部利润。

彼时彼刻,被逼无奈的阿里技术团队痛下决心开始执行“去IOE”计划。(“去 IOE”计划指的是摆脱掉IT部署中原有的IBM小型机、Oracle数据库以及EMC存储的过度依赖。)2013年5月,阿里集团最后一台IBM小型机在支付宝下线。2013年7月,淘宝广告系统使用的Oracle数据库下线,也是整个淘宝最后一个Oracle数据库。(此时此刻,虽然阿里创始人马云以及阿里系深陷资本无序扩张争议,但是包括阿里旗下技术团队在内的所有中国数据库开发人员的实力以及其对中国数据库技术发展的推动不可否认。)

傲慢的Oracle 公司居然对此并无察觉。2013年“双 11 ”过后,Oracle通知阿里巴巴,根据此前公布的 350 亿人民币成交总额补交数据库服务费……其实不仅是阿里,对于中国乃至全球用户来说,“IOE”架构相对封闭,容灾成本高、运维成本高、快速扩容难,不适合互联网企业长期发展。2019年10月15日,亚马逊(Amazon)宣布消费者业务彻底弃用Oracle。亚马逊首席技术官Werner Vogels表示,他在亚马逊最开心的一天是公司关闭了最大的Oracle数据库。

"棱镜门"震醒中国政府

从大趋势来看,Oracle数据库衰退已是必然。但是对于中国数据库市场来说,撼动巨人使其离场并不容易。毕竟从1979年,中国银行史上第一台计算机IBM3032在中国银行(香港分行)启用的那一刻,就已经意味着中国的整个信息技术体系都是遵循美国的技术架构和生态。

从1978 年中国人民大学经济信息管理系首任系主任萨师煊第一次将“数据库”这三个字写在黑板上,到Oracle借“九七工程”(1995年,中国政府要求全国县以上的邮电局,在1997年底前让通信系统完全实现数据共享)成功抢滩中国市场,中国根本没有可以与其抗衡的数据库公司或产品。

这个时期对于中国信息技术的发展来说,核心数据库的应用主要解决的是有且能用的问题。至于是否国产、安不安全可控尚未引起足够重视。虽然在此期间,中国政府已经提出并批准的一项高新科技发展计划诸如863计划、“973”规划以及“核高基“(核心电子器件、高端通用芯片及基础软件产品)重大专项,但是“以美为师”氛围下中国数据库技术概念自主无疑还是“蛰伏”待醒状态。

直到前文所提及的2010年前后,Oracle的高昂成本以及其集中式数据库将数据储存在一台服务器上的不堪重负,激发阿里巴巴这个中国互联网巨头企业,誓言闯出一条自主研发数据库的破局之路。

“棱镜门”曝光引发网络信息安全恐慌。图为2015年6月23日,欧洲理事会就“增强对告密者保护”议题召开听证会,斯诺登通过视频连线参加。(AFP)

破局之路注定艰难,仅有动力并不足够。所以,阿里技术团队OceanBase数据库早期研发之路意料之内地充满坎坷:先期MySQL能满足淘宝大部分业务需求, OceanBase团队濒临解散;业务系统改造量巨大,导致OceanBase无法如期上线……

幸运的是,在此期间,另一件事刺激中国政府不断出手,动用国家宏观政策的力量来推动中国数据库的自主研发。2013 年6月,美国人斯诺登(Edward Joseph Snowden)给英国《卫报》和美国《华盛顿邮报》发送了一份绝密资料:美国 2007 年启动了一项代号为“棱镜”的秘密项目,要求电信巨头威瑞森公司(Verizon Communications)必须每天上交数百万用户的通话记录。消息一出,震惊的不仅仅是美国公民,大量使用美国信息软硬件的中国公司同样备受震动。中国政府如梦方醒,意识到使用美国数据库的巨大国安风险。

国产数据库迎来“天时地利人和”

中国政府的震惊,直接体现在2014年3月的全国两会上,当年国务院总理李克强在《政府工作报告》中首次提及“大数据”,呼吁“在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展。”潜伏在公众视野以外的中国国产数据库公司达梦、金仓、神通、南大等得到了广泛关注,但这些数据库多应用于央企、国家财政、军事等专用领域。

中国政府开始加大要求采购国产数据库的范围与力度,并且随着近年来中美冲击加剧而愈演愈烈。数据库通用领域的相关扶持政策开始更加密集出台。2015年8月,中国国务院发布《促进大数据发展行动纲要》,从国家大数据发展战略的高度,提出了中国大数据发展的顶层设计;中国工信部2017年年初发布的《大数据产业发展规划(2016-2020年)》明确提出了要重视大数据技术与产品的研发、创新应用、培育主体企业、制定标准体系、完善产业体系、提升大数据安全保障能力。

近年来中国宏观政策不断向技术创新倾斜,图为2017全球硬科技创新大会在陕西西安开幕,大会围绕人工智能、航空航天、生物技术、光电芯片、信息技术、新材料、新能源、智能制造等科技领域共举办16场系列论坛活动。(视觉中国)

以OceanBase为代表的中国国产数据库终于迎来“天时地利人和”:宏观政策的支持、传统集中式关系数据库不堪重负触发行业拐点、中国大数据发展提供的机会和应用场景。

从搭建初期稳定性饱受怀疑连内部都拒绝试用,到2014年“双11”支付宝将10%的流水交给OceanBase承担,到2016年“双11”支付宝整个账务库迁移,一个真正的分布式数据库OceanBase 1.0横空出世,阿里技术团队跑了六年的马拉松后终于看到了第一个里程碑。

2019年10月,OceanBase以两倍速度打破甲骨文保持9年之久的TPC-C世界纪录,宣示中国数据库自研技术走到了全球最前沿,为世界技术升级跨出了关键的一步。2020年5月20日,数据库“世界杯”TPC-C再次公布,OceanBase打破2019年自己保持的世界纪录,获得7.07亿tpmC的超高性能得分,OceanBase的这一突破将性能将分数从千万级,提升至亿级,较2019年大幅提升11倍。

当然,放在更宽的范围,OceanBase只是用来表述中国国产数据库现状的一个案例,它在最新的一百多款中国国产数据库流行度排行榜上,甚至只占据第四名的位置,在它前面还有鉴于行业性和传播度因素,导致普通人更不了解的TiDB、达梦数据库、GBase(南大通用)。放到更长的时间线里,老一代的数据库时代尚未谢幕,新一代的数据库百家争鸣已现雏形。一切才刚刚开始,不同的是在新的数据库“世界大战”面前,中国已经有了自己的底气。

中国科技2020议题系列稿件:

「版权声明:本文版权归多维新闻所有,未经授权,不得转载」


X
X
请使用下列任何一种浏览器浏览以达至最佳的用户体验:Google Chrome、Mozilla Firefox、Internet Explorer、Microsoft Edge 或Safari。为避免使用网页时发生问题,请确保你的网页浏览器已更新至最新版本。