一张架构图告诉你数据中台如何搭建

当下 , 刮起了一场数据中台风 , 立马席卷了大数据行业的各个角落 。 人人都在谈什么是数据中台 , 我们需不需要建数据中台 , 数据中台要怎么建?今天 , 小亿结合亿信华辰的实践经验 , 用一张架构图来回答这些问题 , 并让大家看透数据中台架构中每一个部分的功能以及作用 。
谈论数据中台时 , 他们在谈什么“中台”早期是由美军的作战体系演化而来的 , 使用“中台”这种作战体系 , 目的就在于给予前方高效、灵活和强大炮火支持 。 2015年 , 阿里巴巴率先提出了“中台战略” , 以及其有名的“大中台、小前台”的机制 。 2018年8月 , 阿里发布“双中台+ET”数字化转型方法论 , 阿里的双中台包括了数据中台和业务中台 。
在阿里中台概念的引领下 , 很多企业也提出了自己的“中台战略” 。 如把内部一些通用性技术平台、支撑系统打包在一起 , 称之为技术中台;把一些大的业务服务系统 , 逻辑上集中起来称之为业务中台;或干脆把现有的数据仓库、数据治理平台、数据运维平台整合称之为数据中台;还有一种更简单的方式 , 就是把以前内部IT支撑系统的后台直接改名 , 与数据相关的部分就叫数据中台 , 与业务耦合度较紧密的就叫业务中台 。
当下 , 人人都在谈论数字化转型 , 但怎么转 , 做什么 , 中台有可能成为企业推进数字化转型的有效方法之一 。
理想的数据中台架构 , 是什么样的
一张架构图告诉你数据中台如何搭建文章插图
我们先来看下网易严选的数据体系(上图) , 就更清楚数据中台的定位了 。

  • 数据中台的下层是数据平台 , 数据平台主要解决跟业务无关的问题 , 主要是大数据的存储和计算问题 。
  • 数据中台的上层就是数据前台 , 主要包括 BI 报表、数据产品和业务系统 。
  • 数据中台首先赋能分析师通过 BI 报表的形式来驱动业务精细化运营 。
可以看到 , 数据中台的主要作用在于将企业内部所有数据统一处理形成标准化数据 , 挖掘出对企业最有价值的数据 , 构建企业数据资产库 , 对内对外提供一致的、高可用大数据服务 。 下面重点来看看亿信华辰根据多年大数据经验的累积及数据中台的项目实践总结出来的数据中台技术架构 , 主要分为以下5个部分:
一张架构图告诉你数据中台如何搭建文章插图
数据汇聚
数据中台不产生数据 , 数据其实来源于各个业务系统、数据库、网络环境等 , 是日常操作所产生的数据 , 多数存储在网络环境和存储平台中 , 且各个系统之间独立存在 , 很难直接使用 , 需要去进行数据抽取、采集、整合和处理 , 将异构数据采集到统一的平台进行存储 , 进而通过建模将数据进行加工处理 , 变为对业务有用的数据 , 只有这样才能有效汇聚数据 , 形成数据中台的统一数据资源 。
数据存储计算
将采集补录、抽取整合的业务数据汇聚后 , 以数据形态存储 , 当下大数据发展的节奏让数据库技术也由传统关系型数仓架构 , 向Hadoop分布式架构演变 , 并随着业务实时性决策需要 , 推动融合MPP、SQL on Hadoop、流处理等大数据技术服务的实时流式计算存储应用 , 实现海量数据高效统一管理 , 为企业提供实时数据支撑 。
数据治理
数据平台建好后 , 业务数据可能杂乱无章 , 数据质量低 , 需要经过一系列的治理提高数据质量 , 将数据统一起来进行管控 , 这个过程中就包括数据模型管理、数据标准管理、元数据管理、数据质量管理、生命周期管理、数据安全管理 。
数据模型管理是根据业务对数据进行分层、整合处理 , 方便数据的分析应用;元数据管理方便技术人员进行分析数据来龙去脉以及对数据库底层数据质量进行把控;数据标准用来指定一系列标准 , 对元数据进行标准的检查;数据质量是根据一系列规则 , 对库表数据进行校验和整改;数据生命周期和安全贯穿整个流程 , 为数据保驾护航 。