持续定义SaaS模式云数据仓库+AI
简介: 本文由阿里云计算平台事业部 MaxCompute 产品经理孟硕为大家带来《持续定义SaaS模式云数据仓库+AI》的相关分享 。
一、Why:概述与价值(一)人工智能的发展历史人工智能是很早就出现的一个概念 , 起源于上个世纪50年代 , 之后由于种种原因人工智能经历了几十年的漫长的消沉的过程 , 直到最近几年人工智能才火热起来 。 人工智能的发展其实有三次黄金时期:第一次是人工智能概念提出的时候 , 学者们以为AI技术能改变世界 , 但是实际上并没有;第二次是上个世纪80年代左右 , 此时已经提出了神经网络等模拟人脑思考的算法 , 但是也并没有得到很快的发展;第三次可以认为是从2010年左右开始的 , 与前两次不一样的是这次我们有大数据为生产资料 , 以强大的算力、云计算为基础设施 , 包括IOT和5g技术的发展 , 有应用场景驱动 , 比如说搜索就是一个应用人工智能算法的众多场景之一 , 所以这次是人工智能发展真正的黄金时期 。
文章插图
(二)为什么需要MaxCompute+AIGarter在数据分析领域的十大趋势预测如下:
文章插图
从中可以看出 , Garter认为在未来数据与分析的边界逐渐模糊 , 并且预测在2022年 , 40%的机器学习工作将在非以机器学习为主要目的的平台上(如数据仓库)完成 。 因此 , 可以说MaxCompute+AI是大势所趋 。
因为数据仓库承载的是整个企业的数据资产 , 尤其是MaxCompute , 它是一个从TB到EB级 , 能够弹性扩展大量存储能力的数据平台 , 所以数据仓库内置机器学习的优势非常明显:
1.无需移动数据(数据量大) , 降低基础设施成本、人工成本、减少数据安全风险;2.数据访问速度快(让算法找数据);3.可扩展性强;4.纯 SQL ML / Python 更易用 。
而且数据仓库内置机器学习是各角色均收益的一种集成:对于商务人士来说 , 新想法可以快速得到快速试验 , ROI得到提升;对于数据科学家和数据分析师来说 , 大部分工作通过SQL/Python实现 , 易用高效 , 且模型开发和生产环境可以无缝对接;对于数据库管理员(DBA)来说 , 数据管理更加简单 , 安全性更高 。
(三)MaxCompute现有的AI能力MaxCompute的产品特性在之前的讲座中已经具体讲过了 , 这里不再赘述 , 其中MaxCompute集成AI的能力主要有:
- 1.提供SQLML , 可以直接使用标准SQL训练机器学习模型 , 并对数据进行预测分析;
- 2.Mars:使用python科学计算、机器学习三方库;
- 3.可以用用户熟悉的Spark-ML开展智能分析;
- 4.与PAI无缝集成 , 提供强大的机器学习处理能力 。
文章插图
为什么选择SQL和Python这两种语言呢?主要是因为SQL和Python是当前数据处理和机器学习领域中最火的两种语言 。 下面两张图是SQL查询语言的发展及现状以及Python的发展 。
文章插图
文章插图
对于数据处理语言来讲 , 关系型数据库 , 也就是以SQL为基础的关系型数据库 , 包括类似的数据库目前仍然占据了数据处理引擎的前几名 , 有着稳健的生态;而Python已经逐渐成为数据分析领域和数据科学领域的主流语言 , 其有着强大的机器学习生态 。 因此选择这两种语言作为MaxCompute的AI集成 , 既是大势所趋 , 又能减轻使用者的学习成本和迁移成本 。
- 虾米音乐正式宣告关停:国内音乐平台终告别“三国杀”,TME一家独大或将持续
- 零售新物种苏宁趣逛逛,重新定义逛街
- "二八定律"难破 CPU市占率英特尔持续占优
- 科技周刊荐读 | AI重新定义未来建筑;江苏智造,诠释“科技原创”深刻内涵;“万物互联”的“智能社会”还有多远?
- OPPO设计款手机,重新定义折叠屏
- 功能|微软新专利曝光:计算机面板可同时定义外观与功能
- 终于可以自定义喇叭声:你的特斯拉可以“放屁”吓唬人了
- 连获两项科技创新成果,聚好看科技持续发力AI+5G
- 微软正在设想一种可更换的计算机面板 可同时定义外观与功能
- 清华大学研究院出手!擦一次,持续24小时防雾,改变眼镜党体验