对话戴尔科技集团刘志洪 聊一聊非结构化数据存储的那些事儿

在“新基建”的推动下 , 数字化转型与智能物联升级成为大势所趋 , 许多企业都加速向数字化创新工厂迈进 。 此趋势一方面助力万物互联的数字化建设 , 另一方面也带来了数据“井喷式”增长 , 其中大部分数据是非结构化数据 。
如何高效处理非结构化数据成为当今用户的挑战与新痛点 。 戴尔科技集团及时响应用户需求 , 适时推出了PowerScale非结构化数据存储解决方案 , 可将结构化管理引入非结构化数据 , 最大化地释放“新基建”时代数据的作用与价值 。
近日 , 笔者有幸采访到了戴尔科技集团大中华区非结构化数据存储事业部总经理刘志洪先生 , 和刘总围绕非结构化数据存储的概念、市场趋势及戴尔科技集团针对非结构化数据存储的一些举措 , 展开了深入探讨 。
何谓“非结构化数据”?
据IDC预测 , 2018年到2025年之间 , 全球产生的数据量将会从33ZB增长到175ZB , 复合增长率达到27% , 其中超过80%的数据都会是非结构化数据 。 那么 , 什么是非结构化数据?非结构化数据和结构化数据相比有何不同?
据刘志洪表示:“数据就是客观世界的一个数学表达式 。 结构化数据是高度组织和整齐格式化的数据 , 计算机可以很轻松地搜索到它 , 容易被人们使用 。 而非结构化数据本质上是结构化数据之外的一切数据 , 它不符合任何预定义的模型 , 可能是文本的或非文本的 , 也可能是人为的或机器生成的 , 不容易被处理与存储 。 典型的非结构化数据包括文本文件、电子邮件、社交媒体数据、网站、移动数据、通讯、媒体数据等等 。 ”
在谈到非结构化数据和结构化数据区别时 , 刘志洪总结道:除了以上提到的概念性区别之外 , 非结构化数据和结构化数据还存在以下几个区别 , 即非结构化数据的种类繁多、数据的来源广 , 产生的速度比结构化数据更快 , 数据处理和存储更困难 。
当我们在刷短视频 , 网上聊天时 , 是否想到过这些行为的背后带来怎样的数据巨变?包括图像、视频、社交媒体内容在内的非结构化数据的增速惊人 , 远大于结构化数据 。 据Gartner预测 , 从2019年到2024年 , 非结构化数据的总量预计将增加两倍 。 那么 , 随着非结构化数据的扩张 , 客户对非结构化数据存储的需求也直线上升 。 如今 , 客户对于非结构化数据存储提出了哪些需求点呢?
笔者看来 , 在各行各业 , 用户都面临着非结构化数据量大、数据增快的难题 。 毫无疑问 , 企业需要一种简单、流畅、经济高效的方式来储存和使用非结构化数据 。 在这个问题上 , 刘总为我们总结了三大客户需求点:
首先 , 将结构化管理引入非结构化数据(从边缘到核心到云) , 能够消除其复杂性 , 并且可以从小规模应用扩展到很大规模应用 。
【对话戴尔科技集团刘志洪 聊一聊非结构化数据存储的那些事儿】第二 , 它能处理任意用户、任意位置的各种不可预测的工作负载 。 能同时支持边缘、核心和云的存储需求 。
第三 , 能使查找和分析数据变得容易 。 组织需要找到所需的数据 , 无论它们位于何处 。 业务人员需要数据唾手可得;开发人员需要使用它进行编码;IT组织需要处理和管理数据 。 好的解决方案应该是智能的和赋能的 。
笔者认为 , 随着近年来云和边缘计算等技术的兴起 , 越来越多的非结构化数据从传统数据中心转移到云和边缘计算等新场景 , 那么相关的解决方案只有兼顾到这一发展趋势 , 才能立于不败之地 。
“新基建”为数字化转型带来新机遇
“新基建“是以5G、云计算、物联网、人工智能等新一代信息技术为依托 , 对新型基础设施的投入建设 , 及对传统基础设施进行数字化改造 , 推动面向数字经济的全面转型 , 为社会民生、工业、科技等方方面面注入全新的活力 。
随着新型基础设施的全面铺开 , 数据爆发式增长、新一代信息技术的应用需求快速增长、更多基于云的新兴业态及场景纷纷涌现 , 这些趋势都大大加快了企业数字化转型的步伐 。 在“新基建”这个趋势下 , 对于非结构化存储带来了哪些需求和变化呢?
刘志洪表示 , 在“新基建“的推动下 , AI , 5G等新兴技术加速部署 , 人们对信息的渴望被极大的唤起 , 常规的结构化数据交互已经不能满足人们的需求 。 而伴随着数字化的快速发展 , 非结构化数据扮演起越来越重要的角色 , 图片、视频、语音蕴含的丰富信息将被广泛利用 。
另一方面 , 新兴技术的快速发展也提高了行业对非结构化数据的重视程度 。 比如物联网、工业4.0、ADAS、自动驾驶、视频直播等领域的发展产生了更多的非结构化数据 , 而例如人工智能、机器学习、语义分析、图像识别等技术则需要大量的非结构化数据来开展工作 。