数据前线@分布式数据库管理系统有什么作用
文章图片
“分布式”是一种架构风格 , 用其实现“数据存储” , 最现实的目的是为了打开数据库产品的性能天花板 , 并保证系统的高可靠 , 进一步展开 , “分布式数据库”的作用主要有两点:
支持水平扩展 , 保证高性能
通过增加机器节点的方式提升系统整体处理能力 , 摆脱对专用设备的依赖 , 并且突破专用设备方案的性能上限 。 这里的机器节点 , 通常是要支持X86服务器 。
廉价设备+软件 , 保证高可靠
在单机可靠性较低的前提下 , 依靠软件保证系统整体的高可靠 , 又可以细分为“数据存储的高可靠”和“服务的高可靠” 。 总之 , 任何单点的故障 , 可能会带来短时间、局部的服务水平下降 , 但不会影响系统整体的正常运转 。
从技术架构上划分 , 目前的“分布式数据库”主要有以下几种:
MPP
Hadoop技术生态
Like-Mesa
不同的架构都有其各自的优势 , 而用户的复杂商业问题往往需要应用到多种架构的系统 , 目前市面上很少有能提供多架构的数据库产品 , 已知的有亿信的petabase 。
PetaBase是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库系统产品 。 PetaBase被设计为全新的SQLonHadoop解决方案 , 在开源SQL引擎之上进行了大量SQL功能增强和性能优化 , 性能提升数倍甚至上百倍 , 并且集成多项管理工具 , 使其更适合在Hadoop上进行大规模数据分析、检索、查询 。
文章图片
【数据前线@分布式数据库管理系统有什么作用】国产分布式数据库
PetaBase-i是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库系统产品 。 PetaBase-i被设计为全新的SQLonHadoop解决方案 , 在开源SQL引擎之上进行了大量SQL功能增强和性能优化 , 性能提升数倍甚至上百倍 , 并且集成多项管理工具 , 使其更适合在Hadoop上进行大规模数据分析、检索、查询 。
文章图片
PB级数据处理
PetaBase-i采用MPP架构 , 及优化的列存储格式 , 结合存储分区、分布式缓存等技术 , 并针对特定SQL和函数进行性能优化 , 充分利用集群多节点的计算能力和内存 , 能支持复杂的多表JOIN 。 10亿级数据规模以上 , 比传统RDBMS数据库快10倍以上 , TB级数据规模下 , 比Hive快数倍甚至上百倍 。 PetaBase-i动态线性扩展能力 , 更可满足PB级以上大规模数据的处理 。
文章图片
线性扩展高弹性
PetaBase-i支持线性扩展 , 具有高可伸缩性 , 随着集群节点数的扩充 , 其查询并发能力将随节点数增加而增大 。 而查询的响应时间 , 也会随着节点数的增多而缩短 。
PetaBase-i为主/从模式的集群架构 , 主节点上保存有系统元数据 , 但是当主节点挂掉时 , 整个集群都无法使用 , 为此 , PetaBase-i支持配置为高可用的部署模式 , 即将单台主节点架设为二台主节点 , 一台处于活动状态 , 一台处理待命状态 , 从而保证系统的高可用性和高稳定性 。
文章图片
简单易用快速交付
作为一款通用的国产数据库产品 , PetaBase-i兼容标准的SQL语法 , 提供多种应用程序接口 , 包括JDBC、ODBC、CLI、Thrift等 , 因此能支持几乎所有的ETL工具产品 。 基于这些特性 , 用户基于传统数据库开发的应用系统可无缝迁移到PetaBase-i , 从而降低企业对系统移植的转化成本 , 同时让客户的现有数据库开发人员拥有通过SQL就可以使用Hadoop的技术能力 , 加速PetaBase-i应用项目的快速落地 。
- 『Java』java数据结构系列——什么是数据结构
- 靓科技解读Thing,a16z、5.15亿美金的数据加密股票基金:找寻下一个Big
- 大数据邦选址很关键,新基建之大数据中心规划设计原则和内容
- 小熊带你玩科技数据成粤企生产新要素,工业互联网深调研〡从经验依赖到数据驱动
- 人工智能爱好者社区当心这个破坏家庭团结的数据泄露重灾区,多款APP违规采集个人信息
- ETtoday新闻云教授与中国学生在爆发前建模,单日10亿点阅约翰霍普金斯即时数据
- 可可酱江苏省销量同比增长164%,苏宁大数据:头盔成母亲节最特别礼物
- 「荣耀」红米K30Pro全方位吊打荣耀30Pro!数据来源:小米实验室
- 反式只防酸看到了未来的数据设计趋势,从阿里设计年鉴里
- []女生修电脑需要格式化,多达50G的“重要数据”,师傅点开后发现了新大陆