数据|EA、Twitter、Airbnb、Uber,怎么建数据中台

本文由微信公众号 「AI 前线」原创(ID:ai-front),未经授权不得转载,作者:宋文欣
前言
数据中台的概念如今在国内风靡一时,而人们渐渐开始有这样的疑问:中国的数据中台市场如此火热,而国外的数据中台却没有什么声音。
事实并不是这样,硅谷的公司其实已经早于中国建设了所谓的”数据中台“。
只不过,在国外,并没有数据中台这个称谓,而是统一以数据平台的名称命名,但是这个数据平台已经具备我们所说的数据中台的全部功能。
那么,作为全球技术风向标的硅谷企业的“数据中台“到底什么样,他们的“数据中台”是如何建设的?想必很多人对此多充满着好奇和疑问。
以下内容希望可以从侧面给大家提供参考,并不是说硅谷的经验一定要全盘照搬,但可以看硅谷在数据中台建设方面的方法论和技术对自己的业务发展是否有帮助。
一、硅谷的中台论

数据|EA、Twitter、Airbnb、Uber,怎么建数据中台
文章插图
首先分享下硅谷的中台论,硅谷其实没有中台这个词语,这个词是国内特有,最先由阿里提出。
但是硅谷很早就有类似中台的建设,比如 Hadoop 将分布式计算和分布式存储等技术作为中台开放出去,让开发者共享和复用。
我在 Ask.com 任职期间,我们内部的中间件团队会将整个分布式系统里面的监控系统、文件存储等做成组件提供给公司的各技术部门使用,这也是技术中台对外输出的示例。
在 EA整个游戏公司有一个寒霜游戏引擎,刚开始是为射击类游戏创建的开发引擎,整个界面集成了很多功能,游戏开发人员通过拖拉拽的方式将需要的样式和组件拉到开发工具里。当寒霜引擎发展到 3.0 阶段时,EA 的大部分游戏都是通过该平台开发的,其实这就相当于游戏公司的技术中台。
这样的例子在硅谷还有很多,也就是我们今天要分享的内容。
当然,我们首先需要了解数据中台的概念,简单来说,数据中台构建在大数据平台之上,它重点强调数据能力的抽象、共享和复用,其目的是通过数字驱动公司业务、当然对此的理解有很多,我这里不再赘述,今天主要分享的主要内容是——EA 的数据中台建设。
二、EA的数据中台建设
1、EA的游戏家族
如下图,EA 的游戏分为几大类:

数据|EA、Twitter、Airbnb、Uber,怎么建数据中台
文章插图
在 Moblie 方面,手机游戏比较有名的比如植物大战僵尸,很多人应该都玩过。
还有 RealRacing,在某一年 iPhone 手机的发布会上将 RealRacing 作为展示 iPhone 手机强大硬件功能的游戏。
2、EA的游戏数据
EA 的大数据部门成立于 2012 年,下图展示了游戏玩家玩游戏的过程中在数据层面发生的变化,从左边往右边看:

数据|EA、Twitter、Airbnb、Uber,怎么建数据中台
文章插图

数据|EA、Twitter、Airbnb、Uber,怎么建数据中台
文章插图
以 FIFA 为例,FIFA 在 2019 财年拥有 4 千 5 百万 Unqiue player,这些玩家在 90 分钟内可完成将近 50 万场比赛,300 多万脚射门。
考虑到 EA 有将近一百个游戏,这些游戏总和加起来的数据量还是很大的。
3、EA的游戏平台建设
1)早期的数据分析状态
面对这么庞大的数据量,EA 早期的数据分析是怎么做的呢?

数据|EA、Twitter、Airbnb、Uber,怎么建数据中台
文章插图
EA 的特点是很多游戏工作室分布在全国各地,且大部分是收购而来。那么每个游戏工作室按业务部门就会在早期形成自己的烟囱式数据分析管道,每个游戏都有一套数据分析流水线,这就导致数据延迟较大。
如果希望得到整个公司的数据全貌需要花费两到三天的时间才能梳理出来,因为要到各个烟囱里面收集数据。这就导致在 2012 年的时候,整个 EA 的游戏体验不是特别好,游戏发布经常出现宕机,客服也很糟糕,并且当年的美国消费者杂志还将其评为最差劲的公司之一。
这促使 EA 的领导层决心改变现状,开始成立数字平台部门,我就是在那个时候加入 EA,从 0 到 1 打造整个数据平台。
2)数字平台初步形成

数据|EA、Twitter、Airbnb、Uber,怎么建数据中台