阿里双11集团技术总指挥汤兴:一场不亚于移动化的变革已经发生( 二 )

  2016年 , 现任阿里巴巴CEO张勇正式向外宣布淘宝网与无线淘宝合并 , 淘宝成功从PC时代转型为移动时代 。 事后证明 , 如果不是这场变革 , 我们很难见到如今的淘宝 。

  业务形态在变 , 技术必须跟上

  “在云原生的大潮下 , 新一代的技术变更可能才刚刚开始 , 核心交易系统百分百上云可以说是整个基础设施最大的变化以及技术突破 。 但是 , 在基础设施的变化之外 , 整个业务形态也发生了巨大改变 。 ”

  平畴在采访中对InfoQ表示 , 这种业务形态的改变指的就是直播 。 淘宝从2015年就开始做直播 , 短短四年打造了一个年成交千亿的行业 。

  2019 年 , 双 11 直播已成为淘宝内容生态里程碑式的节点 , 其意义可对标 2015 年的淘宝无线化 。 当天 , 淘宝直播成交近 200 亿(2019年双11总交易额为2684亿元) , 超过 50% 的品牌商家通过直播获得增长 。

  如今 , 直播已经成为天猫双11商家的标配 , 直播的内容形式与图文截然不同 , 更强调实时互动和流畅的观看体验 , 而这些特点对消息通道、网络和 CDN 等软硬件资源提出了苛刻的要求 。

  既要保证用户体验 , 又要追求技术上的最低成本 , 包括最小带宽消耗、最大机型覆盖等 。 平畴带领的技术团队遇到了很大挑战 。

  为了解决直播中可能遇到的问题 , 淘宝直播技术团队自研音视频实时通信引擎 , 采用去中心化的设计方式 , 支持横向级联 , 实现大规模低延时直播 , 时延从原先的5到7秒降低至 1 秒内 , 并在弱网下有更好的表现 。

  虽然做足了准备 , 但平畴回想起当下 , 坦言还是有些担心:“很怕发生预期外的问题 , 尤其是新场景、新用户动线和新架构 。 ”

  实践证明 , 历年双11期间产生的相对严重问题 , 往往都不是我们预先最担心的问题 , 甚至绝大多数可能不在预期内 。

  道理很简单 , 无论项目的挑战或风险有多大 , 只要在双11前能预想到 , 技术侧就一定会做好预案应对最差情况 , 并且做好演练工作 。 对于预期外的问题 , 往往是没有准备预案或者预案有效性没有经过验证 , 遇到这种情况就非常挑战整个技术团队应急解决问题的能力了 。 不过 , 这也是双11的魅力所在:

  我们永远没有办法对所有问题做好预案 , 永远有未知的挑战在前方等待 , 而我们唯有通过技术升级去不断地逼近那个能够做到的最好的极限 。

  所以 , 对技术人来说 , 双11永远没有做的最好 , 只有做的更好 。

  3.提前一年 , 决定上云

  今年双11 , 我们把“最要命”的系统全都放在云上 。

  这是当时阿里巴巴集团CTO、阿里云智能总裁行癫在双11当晚说的一句话 。 如开篇所言 , 2019年双11 , 阿里实现了核心交易系统 100% 上云 , 而这个决定早在一年前就做出了 。

  “每年双11结束 , 全集团都会进行一次全面的技术复盘 , 除了复盘在整个双11过程中的得与失 , 更重要的是 , 确定下一年双11技术的整体方向 。 2018年双11复盘时 , 集团就整体确定了将核心电商搬到云上的大策略 。 ”