云上精选 华为云FusionInsight引领“数据新基建”持续发展

摘要:一个统一的现代化的数据基建需要三类架构来实践三种不同的应用场景 。
近期 , 美国知名科技企业风投机构A16Z总结出一套通用的技术架构服务 , 分为以下三种场景 。 一、数据基建架构全景
云上精选 华为云FusionInsight引领“数据新基建”持续发展
文章图片
数据流向显示 , 左侧的数据源经数据处理(批量、实时流、事件流等)将数据统一汇聚到数据湖或数仓中 , 通过数据科学或机器学习进行AI分析 , 通过ADHoc和实时分析为客户或APP提供敏捷的结果数据 。 华为云FusionInsight为政企客户提供一站式全场景的云原生数据湖 , 围绕政企客户在采存算管用等数据全生命周期提供领先的整体解决方案 , 方案主要包含MRS大数据、DWS数据仓库、一站式数据治理中心等云服务 , 助力政企客户释放海量数据价值!其架构如下:
云上精选 华为云FusionInsight引领“数据新基建”持续发展
文章图片
上千个大型客户已经基于FusionInsight架构构建其大数据应用平台 。
A16Z经过调查相关业内人士得出一个结论:一个统一的现代化的数据基建需要三类架构来实践三种不同的应用场景 。
现代化BI架构
多模式数据处理架构
人工智能和机器学习架构1.现代化BI架构
云上精选 华为云FusionInsight引领“数据新基建”持续发展
文章图片
这是对小型数据团队和预算有限的企业的默认选项 , 企业逐渐从传统数仓迁移到这个架构 , 利用云的灵活度和可扩展性 。
应用场景包含:报表 , 仪表盘 , 自助式分析 , 主要使用SQL来分析结构化数据 。
优势:前期投入低 , 启动快 , 市场上人才储备充分 。
缺陷:对于数据场景复杂的团队不适用 , 比如需要数据科学 , 机器学习 , 或者实时场景 。
传统的小型数据团队其面对的数据基本以核心交易系统的RDBMS结构化数据为主 , 数据量在GB级 , 普通的数仓都可支持其数据的分析挖掘 , 无需大数据支撑就可完成 , 这种处理方式在2008年时的大型企业中也较为常见 , 其数据量较小基本上使用数仓就可完成日常的数据大屏、数据分析等工作 。 这是对小型数据团队和预算有限的企业的默认选项 , 利用云的灵活度和可扩展性 , 企业逐渐从传统数仓迁移到这个架构 。
华为云FusionInsight可提供企业级数仓 , DWS目前服务于全球1000+大型客户 , 广泛应用于政府、金融、运营商、大企业等领域 。 产品始于2011年 , 经历将近10年技术积累 , 已取得180+国内外授权专利 。 DWS可支撑日常的结构化数据分析 , 其具有如下特点:
大规模:GaussDB(DWS)基于分布式架构 , 在保证ACID的基础下 , 突破大规模分布式场景下集群通信(Multi-Streams)、逻辑集群(Multi-Groups)技术 , 具备2048节点扩展能力 。 值得一提的是 , 逻辑集群可将ODS、数据仓库、数据集市、自助分析等不同业务负载 , 有机的统一起来 , 有效隔离、有效共享 。
高性能:GaussDB(DWS)具备多层级全并行计算引擎 。 支持多个物理节点并行计算 , 在一个物理节点内部 , 支持多个CPU核心并行计算 , 在一个CPU核心的指令序列中 , 支持SIMD指令 , 实现一个指令同时操作多条数据 。 将并行能力发挥到极致 , 为业务提供极致的性能 。 另外 , Multi-Cores技术使得在鲲鹏上性能相比同代x86芯片提升30%以上 。
高可靠:GaussDB(DWS)具备多层级容灾能力 , 在AZ、集群、节点及进程出现软硬件异常的情况下能够平滑处理 。 另外 , Server端Multi-Retries技术大幅减少故障失败的业务感知;其次 , 在棘手的亚健康问题上 , GaussDB(DWS)也有完善的检测和处理机制;最后 , 离线扩容、半在线扩容、在线扩容技术能够从容应对客户不同的扩容需求 。
华为云DWS数据仓库技术核心是分布式架构 , 过去十年一直围绕分布式构筑竞争力 。 未来 , GaussDB(DWS)数据仓库将基于分布式架构持续演进 , 围绕云、大数据、5G/IoT、人工智能 , 构筑下一代开放的、全场景分析型数据库 。 2.多模式数据处理架构