「阿里巴巴」阿里双11集团技术总指挥汤兴:一场不亚于移动化的变革已经发生( 三 )


第二个阶段 , 建立上云保障小组 。
淘系内部将云和电商相关的研发一起拉通 , 明确响应机制和负责人 , 打通两边的变更系统和告警系统 , 细化云告警信息中明确关于电商应用相关的信息 。 通过不定时的模拟攻击云环境 , 推动两边对故障处理的应急能力提升 。
新零售线专门成立了上云、用云项目组 , 阿里云也有专门的项目成员进行对接 。 同时 , 我们有专业的PMO来保障跨团队的项目合作 , 保障日常的周/月例会进行信息同步以及项目推进 , 针对演练中不同的线上问题有专门的应急机制 , 双11项目的横向拉通保障工作也随着多年的技术升级而不断沉淀经验 。
为了保障云上的容载能力 , 双11技术项目组组织了多次云上突袭演练 , 演练云上单元机房不可用情况下的应急手段 。 通过持续迭代逐步将核心业务搬到云上 , 过程中持续进行云上回归测试以及切流演练 , 在双11前的几次大促中也验证了线上的用云稳定性 。
第三个阶段 , 结合云技术探索新的研发方式 。
上云的过程中 , 云技术在向云原生发展 。 除了神龙服务器(阿里云弹性裸金属服务器)之外 , 新的ASI容器也大规模使用 。 为了探索Serverless的价值 , 淘系技术结合云技术构建了自己的函数平台FaaS , 覆盖淘宝互动、闲鱼、导购、躺平等多个业务场景 。 这个平台一方面大幅提升了研发效率 , 另一方面提供了云端一体的轻量级研发方式 。
(淘系自研云端一体函数平台 Gaia架构图)
在上云的过程中 , 我们看到基础设施变厚了 , 研发变得轻了 , 推动业务研发从Procode走向Lowcode , 进而聚焦业务研发 , 可以更大地释放研发生产力 。
4.端侧AI决策140亿次
上云、做AI , 这是近两年所有重视技术研发的科技公司的大主题 。 在上云之前 , 阿里淘系就开始研发端侧的智能应用 , 这也符合当下国人的消费习惯 , 大部分消费者习惯通过移动端进行交易 。
2019年 , 手淘大规模使用端上AI技术 , 在客户端实现对用户行为的实时感知 , 应用深度神经网络进行用户意图识别 , 并根据识别结果进行智能决策 , 做到推荐内容的实时更新 , 大幅提升个性化推荐效果和用户体验 。
2019年双11当天 , 端侧AI决策一共运行了140亿次 , 对于信息流的个性化推荐、消息的智能投递、直播的商品智能检测 , 效果上都有非常大幅度的提升 。 平畴表示 , 淘系技术部的轻量级深度学习端侧推理引擎MNN已经开源 , 这种有效利用云与端的各自数据和计算优势的方式一定是未来的发展趋势 。
除了端侧的AI技术研发 , 阿里淘系也正在将深度学习、机器视觉和3D技术结合在一起 , 形成3D AI的方向 , 并将之应用于躺平家装和家居领域 。
最近五到十年 , 人工智能技术有了突飞猛进的进展 , 集中表现在深度学习 , 以及深度学习和人工智能问题的结合上 , 但是越来越多人对于人工智能技术是否可以再取得突破有所疑虑 。 平畴坦言 , 过去两三年 , 业界对人工智能的作用有过度夸大 。 人工智能提升甚至创造新的场景需要和业务、产品、工程的深度结合 , 这需要较长的时间摸索 。 理想和现实的差距让人们转而认为人工智能达到了瓶颈 , 这是缺少对技术到产品转化规律的耐心和尊重的表现 。
新的人工智能应用场景的出现不仅需要人工智能技术发展这单一的条件 , 更是依赖数据、业务和产品的发展 。 因此 , 开发人工智能新场景不仅仅是人工智能技术团队的工作 , 也不是简单的理论结合实际 , 而是需要打造基础设施、新产品、新的数据的积累 。 有了这些条件 , 人工智能的新场景才会源源不断的孕育出来 。
人工智能是战术 , 核心还是具体场景的需求满足 , 如何准确定义场景和相应的衡量体系才是人工智能发挥所长的前提 。
5.未来规划
2019年的双 11 过后 , 阿里内部同样召开了一场复盘会 。 平畴透露 , 2019年的双11是技术历史上消费者最顺滑的一次 , 交易核心链路全面上云 , 淘宝直播的同时在线人数也创了历史新高 。 未来 , 阿里会持续不断提升购物车、下单等核心链路的消费体验 , 同时通过技术升级的手段大幅优化整体资源使用效率 , 降低大促过程中的技术资源使用成本 。