数据前线@分布式数据库管理系统有什么作用 “分布式”是一种架构风格

文章图片
“分布式”是一种架构风格，用其实现“数据存储” ，最现实的目的是为了打开数据库产品的性能天花板，并保证系统的高可靠，进一步展开， “分布式数据库”的作用主要有两点：
支持水平扩展，保证高性能
通过增加机器节点的方式提升系统整体处理能力，摆脱对专用设备的依赖，并且突破专用设备方案的性能上限。这里的机器节点，通常是要支持X86服务器。
廉价设备+软件，保证高可靠
在单机可靠性较低的前提下，依靠软件保证系统整体的高可靠，又可以细分为“数据存储的高可靠”和“服务的高可靠” 。总之，任何单点的故障，可能会带来短时间、局部的服务水平下降，但不会影响系统整体的正常运转。
从技术架构上划分，目前的“分布式数据库”主要有以下几种：
MPP
Hadoop技术生态
Like-Mesa
不同的架构都有其各自的优势，而用户的复杂商业问题往往需要应用到多种架构的系统，目前市面上很少有能提供多架构的数据库产品，已知的有亿信的petabase 。
PetaBase是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库系统产品。 PetaBase被设计为全新的SQLonHadoop解决方案，在开源SQL引擎之上进行了大量SQL功能增强和性能优化，性能提升数倍甚至上百倍，并且集成多项管理工具，使其更适合在Hadoop上进行大规模数据分析、检索、查询。

文章图片
【数据前线@分布式数据库管理系统有什么作用】国产分布式数据库
PetaBase-i是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库系统产品。 PetaBase-i被设计为全新的SQLonHadoop解决方案，在开源SQL引擎之上进行了大量SQL功能增强和性能优化，性能提升数倍甚至上百倍，并且集成多项管理工具，使其更适合在Hadoop上进行大规模数据分析、检索、查询。

文章图片
PB级数据处理
PetaBase-i采用MPP架构，及优化的列存储格式，结合存储分区、分布式缓存等技术，并针对特定SQL和函数进行性能优化，充分利用集群多节点的计算能力和内存，能支持复杂的多表JOIN 。 10亿级数据规模以上，比传统RDBMS数据库快10倍以上， TB级数据规模下，比Hive快数倍甚至上百倍。 PetaBase-i动态线性扩展能力，更可满足PB级以上大规模数据的处理。

文章图片
线性扩展高弹性
PetaBase-i支持线性扩展，具有高可伸缩性，随着集群节点数的扩充，其查询并发能力将随节点数增加而增大。而查询的响应时间，也会随着节点数的增多而缩短。
PetaBase-i为主/从模式的集群架构，主节点上保存有系统元数据，但是当主节点挂掉时，整个集群都无法使用，为此， PetaBase-i支持配置为高可用的部署模式，即将单台主节点架设为二台主节点，一台处于活动状态，一台处理待命状态，从而保证系统的高可用性和高稳定性。

文章图片
简单易用快速交付
作为一款通用的国产数据库产品， PetaBase-i兼容标准的SQL语法，提供多种应用程序接口，包括JDBC、ODBC、CLI、Thrift等，因此能支持几乎所有的ETL工具产品。基于这些特性，用户基于传统数据库开发的应用系统可无缝迁移到PetaBase-i ，从而降低企业对系统移植的转化成本，同时让客户的现有数据库开发人员拥有通过SQL就可以使用Hadoop的技术能力，加速PetaBase-i应用项目的快速落地。