数据中台|阿里数据中台大火,国外却在建设数据湖,这两者什么关系?( 二 )


阿里巴巴数据中台
实际上阿里的数据中台并不是一套产品 , 而是阿里的数据中台方法论体系+生态产品 。
数据湖与数据中台的关系看过了各大厂的数据湖和数据中台 , 我们回过头来再来看数据湖与数据中台的关系 。
大数据时代 , 数据量越来越多 , 数据形式日益复杂 , 而以数据仓库为代表的、现有的数据存储和处理技术无法满足海量、多样的数据处理需求的背景下产生的 。 “数据湖”是将复杂的事物具象化 , 偏技术一些 , 以一个形象的名字 , 反应了它在大数据存储和大数据处理方面的优势和能力 。
数据湖作为一个集中的存储库 , 可以在其中存储任何形式(结构化和非结构化)、任意规模的数据 。 在数据湖中 , 可以不对存储的数据进行结构化 , 只有在使用数据的时候 , 再利用数据湖强大的大数据查询、处理、分析等组件对数据进行处理和应用 。 因此 , 数据湖具备运行不同类型数据分析的能力 。
数据中台从技术的层面承接了数据湖的技术 , 通过数据技术 , 对海量、多源、多样的数据进行采集、处理、存储、计算 , 同时统一标准和口径 , 把数据统一之后 , 以标准形式存储 , 形成大数据资产层 , 以满足前台数据分析和应用的需求 。
数据中台更强调应用 , 离业务更近 , 强调服务于前台的能力 , 实现逻辑、算法、标签、模型、数据资产的沉淀和复用 , 能更快速的相应业务和应用开发的需求 , 可追溯 , 更精准 。
数据湖和数据中台哪家强?我们都数据中台了 , 为什么老外还在数据湖?
随着以大数据、云计算、人工智能等新技术为主要特征的到来 , 大数据战略的布局和“新基建”的发展 , 我相信 , 在这场数字化的变革中 , 我们的技术创新能力也一定会追上!
最后 , 再回答网友的一个问题:数据湖与数据中台哪家强?
在笔者来看 , 不论是数据湖还是数据中台 , 都是“千人千面”的 , 不同的人理解不同 , 数据湖和数据中台也没有孰弱孰强之说 。
对企业而言 , 不为眼花缭乱的“概念”所迷惑 , 一切要从实际需求出发 , 不能人云亦云 , 盲目跟风 , 也不能墨守成规、固步自封 。
【数据中台|阿里数据中台大火,国外却在建设数据湖,这两者什么关系?】企业数据项目的建设还是应当从企业的业务需求出发构建与企业相匹配的一套数据管理和使用流程 , 以及与之需求相匹配的数据平台和工具 。