英特尔|英特尔的1/6:打通从硬件到应用的中间层( 二 )


数据是英特尔转型的大方向,而AI则是应对庞大数据流的不二法门。当各行各业的工业和商业客户面对新的数据和AI时代时,如何高效、无缝、可扩展地将新的AI算法应用到现有的大数据平台上,成为大量企业的“AI之痛”。
英特尔|英特尔的1/6:打通从硬件到应用的中间层】对阿里云、腾讯云、万事达卡、银联、美的等公司和品牌来说,Analytics Zoo可以端到端地帮助它们将“大数据分析+流水线”应用到实际生产环境当中。
英特尔大数据技术全球CTO、大数据分析和人工智能创新院院长介绍戴金权,Analytics Zoo是英特尔开源“大数据+AI”软件平台,构建在oneAPI又或是Python库等深度学习框架,以及如Spark、Flink、Ray等数据处理分析框架之上。
Analytics Zoo的能力分为三层:提供端到端的数据流水线能力的“底层”、提供机器学习工作流的“中间层”和构建海量应用场景的“上层”。戴金权介绍,实际上,Analytics Zoo“大数据+AI”平台已经商用于非常丰富的场景中。
在美国汉堡王,当顾客开始点单,收银员把商品输入到客户订单中时,汉堡王希望构建一个模型,能够将这些点单的行为以及相关的信息可以收集起来,进而后续对用户进行进一步甜品、小食、饮料等推荐。一开始,汉堡王为此构建了深度学习和大数据处理两个模型,但效率非常低下,后来,在与英特尔合作之后,汉堡王将整个端到端的数据处理和模型训练全都迁移到基于Analytics Zoo的统一平台上,利用Spark、Mxnet、Ray等进行数据处理、分析、分布式模型、训练等,大大提高了AI和数据处理效率。
SK电信是韩国最大的电信公司,遍布城市的4G、5G基站每秒可以生成140多万条网络质量记录,SK电信为此构建了一个复杂的大数据平台。但令SK电信头疼的是,从基站到系统后台,端到端产生了海量需要传输、拷贝的数据流,同时每几秒都会产生新的数据,有时这些数据非常重要,AI需要借此重新评估当前的网络质量。
英特尔|英特尔的1/6:打通从硬件到应用的中间层
文章插图
为此,SK电信与英特尔合作,将整个架构迁移到Analytics Zoo平台上来,直接在Spark集群上对数据进行处理,并存储在内存当中,分布在整个集群上,随后再直接利用TensorFlow模型基于内存上的数据来进行训练和推理。
结果,SK比对发现,Analytics Zoo将整个端到端的统一流水线基于内存数据进行边缘处理,最终,“SK电信在推理上实现了3~6倍的性能提升,而训练最高可以达到4倍提升。”