华为云专家深度解读:万物互联的智能时代,云原生技术与边缘计算将擦出怎样的火花?

  随着5G的规模商用以及AI技术在各行各业的逐步普及,新型智能应用及终端正对体验、时延、带宽、安全等数字业务的关键要素提出全新的挑战,而边缘计算正在成为应对挑战的核心手段 。 据Gartner预测,到2022年,边缘计算将成为所有数字业务的必要需求 。

  在近日举办的华为开发者大会2020(Cloud)上,华为云智能边缘平台IEF首席架构师张琦深度解读了十万边缘节点的管理技术,以及如何通过云原生技术和边缘计算结合,构建边缘计算实战场景中所需的业务下沉、云边协同及离线自治等关键能力 。

  从“Cloud Native”到“Edge Native”的挑战

  标准的边云协同模型,对Cloud Native技术有六大协同诉求:服务协同,业务管理协同、应用管理协同、智能协同、数据协同,以及云边的资源协同 。


华为云专家深度解读:万物互联的智能时代,云原生技术与边缘计算将擦出怎样的火花?

----华为云专家深度解读:万物互联的智能时代 , 云原生技术与边缘计算将擦出怎样的火花?//----

  举例来说,应对智能协同的需求,可采用“云上训练,边缘推理”的思路:

  云端,人工智能服务利用海量计算资源,完成海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成;

  边缘侧,边缘服务将云上训练好的AI应用以容器或函数形式推送到边缘节点,提供边云传输通道,联动边缘和云端的数据,支撑AI应用实现边云智能协同,同时提供升级、监控、日志等运维能力;

  边缘AI容器/函数加载模型,实时从设备获取数据,通过推理进行瑕疵检测,根据结果调整生产设备的参数,提升良品率 。 边缘产生的数据和推理结果周期上传到云上,用于持续模型训练和生产分析 。

  然而在此之上,“Edge Native”应用的一系列特殊需求,如极致的轻量化、离线自治及故障自愈及超大规模节点管理等,对Cloud Native技术提出了更高的要求:


华为云专家深度解读:万物互联的智能时代,云原生技术与边缘计算将擦出怎样的火花?

----华为云专家深度解读:万物互联的智能时代 , 云原生技术与边缘计算将擦出怎样的火花?//----

  极致的轻量化:端侧设备由于资源有限,对边缘计算平台的资源占用往往有较强约束 。 通过对已有框架的插件化实现以及实施轻量化改造(裁剪边缘侧不适用场景、重写模块等),加上容器引擎的轻量化实现,可以有效提升边缘业务并发启动速度,并大幅降低稳态下的内存占用;

  离线自治及故障自愈:工业制造、交通等领域经常会有边缘节点离线的场景,要保证业务高可靠,离线节点需要具备故障迁移、多实例运行以及本地恢复等能力 。 实现思路:依据先预选、再优选的方式基于调度优先级构建边缘部署优选树;再依据调度优先级的顺序对高优先级节点进行监控,决策是否接管调度;最后依据边缘部署优选树进行节点调度决策传递,当本节点接管调度决策后,依据设置好的调度策略对应用在本节点进行调度;

  大规模节点管理:一方面是南北向大流量冲击问题,如何在带宽有限的情况下保证边云信息交互,以及并发操作带来的DB过载,需要设计得当的边云消息优化、系统保护以及流程优化策略;另一方面,出于成本考虑,云边通道的带宽往往非常小,在中心云侧做大规模边缘应用分发将造成灾难性的拥塞,此时则需要建立边缘镜像加速站点,自动同步主镜像仓库中选定的镜像,利用边缘侧本地大带宽向同一区域的边缘节点提供镜像下载服务 。