#中国IDC圈#终于有人把云计算、大数据和人工智能讲明白了( 六 )


有了容器 , 使得PaaS层对于用户自身应用的自动部署变得快速而优雅 。
三、大数据拥抱云计算
在PaaS层中一个复杂的通用应用就是大数据平台 。 大数据是如何一步一步融入云计算的呢?
1数据不大也包含智慧
一开始这个大数据并不大 。 原来才有多少数据?现在大家都去看电子书 , 上网看新闻了 , 在我们80后小时候 , 信息量没有那么大 , 也就看看书、看看报 , 一个星期的报纸加起来才有多少字?如果你不在一个大城市 , 一个普通的学校的图书馆加起来也没几个书架 , 是后来随着信息化的到来 , 信息才会越来越多 。
首先我们来看一下大数据里面的数据 , 就分三种类型 , 一种叫结构化的数据 , 一种叫非结构化的数据 , 还有一种叫半结构化的数据 。
结构化的数据:即有固定格式和有限长度的数据 。 例如填的表格就是结构化的数据 , 国籍:中华人民共和国 , 民族:汉 , 性别:男 , 这都叫结构化数据 。
非结构化的数据:现在非结构化的数据越来越多 , 就是不定长、无固定格式的数据 , 例如网页 , 有时候非常长 , 有时候几句话就没了;例如语音 , 视频都是非结构化的数据 。
半结构化数据:是一些XML或者HTML的格式的 , 不从事技术的可能不了解 , 但也没有关系 。
其实数据本身不是有用的 , 必须要经过一定的处理 。 例如你每天跑步带个手环收集的也是数据 , 网上这么多网页也是数据 , 我们称为Data 。 数据本身没有什么用处 , 但数据里面包含一个很重要的东西 , 叫做信息(Information) 。
数据十分杂乱 , 经过梳理和清洗 , 才能够称为信息 。 信息会包含很多规律 , 我们需要从信息中将规律总结出来 , 称为知识(Knowledge) , 而知识改变命运 。 信息是很多的 , 但有人看到了信息相当于白看 , 但有人就从信息中看到了电商的未来 , 有人看到了直播的未来 , 所以人家就牛了 。 如果你没有从信息中提取出知识 , 天天看朋友圈也只能在互联网滚滚大潮中做个看客 。
有了知识 , 然后利用这些知识去应用于实战 , 有的人会做得非常好 , 这个东西叫做智慧(Intelligence) 。 有知识并不一定有智慧 , 例如好多学者很有知识 , 已经发生的事情可以从各个角度分析得头头是道 , 但一到实干就歇菜 , 并不能转化成为智慧 。 而很多的创业家之所以伟大 , 就是通过获得的知识应用于实践 , 最后做了很大的生意 。
所以数据的应用分这四个步骤:数据、信息、知识、智慧 。
最终的阶段是很多商家都想要的 。 你看我收集了这么多的数据 , 能不能基于这些数据来帮我做下一步的决策 , 改善我的产品 。 例如让用户看视频的时候旁边弹出广告 , 正好是他想买的东西;再如让用户听音乐时 , 另外推荐一些他非常想听的其他音乐 。
用户在我的应用或者网站上随便点点鼠标 , 输入文字对我来说都是数据 , 我就是要将其中某些东西提取出来、指导实践、形成智慧 , 让用户陷入到我的应用里面不可自拔 , 上了我的网就不想离开 , 手不停地点、不停地买 。
很多人说双十一我都想断网了 , 我老婆在上面不断地买买买 , 买了A又推荐B , 老婆大人说 , “哎呀 , B也是我喜欢的啊 , 老公我要买” 。 你说这个程序怎么这么牛 , 这么有智慧 , 比我还了解我老婆 , 这件事情是怎么做到的呢?
#中国IDC圈#终于有人把云计算、大数据和人工智能讲明白了
文章图片
2数据如何升华为智慧
数据的处理分几个步骤 , 完成了才最后会有智慧 。
第一个步骤叫数据的收集 。 首先得有数据 , 数据的收集有两个方式:
第一个方式是拿 , 专业点的说法叫抓取或者爬取 。 例如搜索引擎就是这么做的:它把网上的所有的信息都下载到它的数据中心 , 然后你一搜才能搜出来 。 比如你去搜索的时候 , 结果会是一个列表 , 这个列表为什么会在搜索引擎的公司里面?就是因为他把数据都拿下来了 , 但是你一点链接 , 点出来这个网站就不在搜索引擎它们公司了 。 比如说新浪有个新闻 , 你拿百度搜出来 , 你不点的时候 , 那一页在百度数据中心 , 一点出来的网页就是在新浪的数据中心了 。