分布式|面向未来,分布式数据库能有哪些新的突破( 二 )


OceanBase 在行业中的实践与方法在上午的活动中,值得关注的当属 OceanBase CTO 杨传辉对于分布式数据库整体的技术发展进行的解读。从 2010 年开始蚂蚁集团便致力于 OceanBase 的研发,如今不论在性能、可扩展性、兼容性还是开源方面都取得了不错的成果。
一体化架构【 分布式|面向未来,分布式数据库能有哪些新的突破】作为原生分布式数据库的佼佼者,OceanBase 背后的主要核心技术就是一体化架构。通过一体化架构,OB 能够发挥出双重技术优势:

  • 分布式:底层是原生分布式架构,依然拥有分布式技术无限扩展,动态增减服务器的技术红利。
  • 集中式:完全兼容集中式数据库功能和单机性能,同时支持 OLTP 和 OLAP,简称 HTAP。
OceanBase 一体化架构的核心技术理念那就是既要分布式,又不能牺牲性能,用一个通俗的话来讲就是两手抓,两手都要硬!每一个数据库都离不开 SQL、事务和存储三个技术模块,如果将事务层和存储层分离,再抽取一个单独的分布式KV系统,可以简单直接的实现一个分布式数据库,但是会牺牲单机性能,造成系统高延迟,不适合在核心业务系统使用;然而,OceanBase 通过一体化架构将事务层和存储层有机结合,不牺牲单机性能的同时又能做到与集中数据库相当的水平,完全可以适用于核心业务场景。
OceanBase 的一体化架构包括了三个核心技术模块:
  • 原生分布式:底层是基于 Paxos 的灵活容灾架构,其上一层是一个一体化架构,兼具单机性能优势,易用性以及扩展性,并且保证全机的强一致性。
  • HTAP:OceanBase 在一套 HTAP 引擎中同时支持 OLAP 和 OLTP 混合负载,并且做到了良好的资源隔离。
  • 两种兼容模式:同时兼容两种 SQL 使用接口,商业数据库 Oracle 和开源数据库 MySQL,保证集中式数据库到分布式数据库的平滑迁移。
OceanBase 的核心理念是把简单留给客户,把复杂留给数据库,因此选择了对客户更加友好,更加简单的一体化架构。
开源版本在 2021 年 6 月份,OceanBase 正式面向全球开源开放,每一个用户都可以通过下载 OceanBase 社区版快速学习和使用。OceanBase 在开源上与其他项目可能不同,十年内核能力的积累,大量的代码开源,必然花费了很多心思和努力。开源是为了更好的发展,相信点点滴滴将汇聚成满天星河,开源会越做越好。
同时,OceanBase 在社区建设上也是大力发展,一个好的社区必然离不开开源的支撑,能够加速生态建设。通过开源,能够更快速让更多的数据库管理者,使用者或者说学习者,都能够参与到这个分布式数据库生态里面,这样能够比以前 Oracle 建设生态要更快,通过开源能够更快的完成生态建设。
技术路径OceanBase 自 2010 年立项以来,已经过了 11 年,一直保持着不断的突破和创新。同样的,分布式数据库也经历了三次技术迭代,从最早的 NoSQL 系统走向今天的原生分布式数据库。
  • 第一代分布式数据库是一个分布式的存储系统,也被称为 NoSQL。
  • 第二代分布式数据库采用搭积木的方式,在 NoSQL 的基础之上引入了 SQL 的支持,支持基本的 SQL 功能,但是往往都牺牲了单机的性能和成本。
  • 第三代原生分布式数据库,追求极致,支持完整的企业级 SQL 功能,并且做到单机性能与集中数据库基本相当。
OceanBase 十一年以来一直坚持自主研发,秉持只有自主研发才能完全掌控内核,只有完全掌控内核才能够持续在原生分布式数据库领域开拓创新。所以,OceanBase 的原生分布式数据库也经历了三次迭代:
  • 第一代分布式存储系统:将 LSM 首次引入到关键数据库领域里面,大幅降低关键数据库的存储成本。
  • 第二代分布式数据库:OceanBase 再次将 paxos 协议引入到关键数据库领域里面,首次做到 IPO 等于零。
  • 第三代原生分布式数据库:OceanBase 做到在一套引擎同时支持 OLTP 与 OLAP 混合负载,并且参与 TPC-C 和 TPC-H 打榜都取得世界第一的成绩。
2021 年 OceanBase 又取得五大核心产品技术突破: