2020双十一,阿里云GRTN拉开直播和RTC技术下半场序幕( 二 )


所以上述各个环节应该是环环相扣 , 做到全链路相互感知才能将延时压缩到极致 。
业界主流低延时直播方案对比业界主流的5种流媒体协议和技术 , 其中包括WebRTC、QUIC、SRT、CMAF、LLHLS 。这里的对比从下述8个维度来展开:
2020双十一,阿里云GRTN拉开直播和RTC技术下半场序幕文章插图
提出时间:WebRTC是最早被提出的 , QUIC紧随其后 , 最晚的是去年Apple新发布的LLHLS完备度:这里的完备度主要关注这项技术是否涉及我们前面提到的直播全链路中的各个环节 , 比如WebRTC我们认为是全覆盖的 , 它涉及了从采集、编解码、传输和渲染的全部环节 , 所以严格来讲WebRTC并不是一个协议 , 而是一个开放的实时流媒体通信框架;那我们再来看QUIC , 它是一个正在被IETF标准化的新一代传输协议;SRT在2017年刚开源的时候的只是一个视频传输协议 , 但随着很多编码器厂商的支持 , 也开始可以影响编码侧的码率 , 从而保持相对稳定的时延 。 底层传输协议和类型:WebRTC、QUIC、SRT都是基于UDP的而且都是流式的传输 , 而CMAF和LLHLS都是切片方式的 , 底层基于HTTP 。
标准和终端支持:WebRTC已经是W3C标准 , 并且使用了大量的IETF RFC规范 , 目前几乎所有的浏览器以及手机操作系统都支持WebRTC;QUIC预计在今年年底会正式成为下一代HTTP标准即HTTP/3 , 目前Chrome已经支持 。
场景和延时:WebRTC是为实时音视频通信场景设计 , 端到端延时是在400ms以内 , 250ms左右; 而其它几个协议要做到2s以内 , 都还需要很多的额外技术投入 。
综合各方面因素 , 阿里云的新一代传输网络选择了WebRTC技术 , 不仅延时低 , 而且支持单通道全双工 , 可以做到真正意义上的低延时+互动 。
GRTN的定位为了能够降低直播的端到端延时 , 阿里云CDN与视频云联合手淘技术、达摩院XG实验室在先后从直播、短延时直播拓展到RTC领域 , 并在 QoS和AAA方面发力 , 最终成功构建了GRTN(Global Realtime Transport Network)全球实时传输网 。
GRTN的定位是基于中心云和边缘云的异构节点 , 构建超低延时、全分布式下沉的通信级流媒体传输网络 。 GRTN目前融合了互联网直播和RTC等多种业务场景的音视频流传输和交换 。 基于GRTN的短延时直播RTS可以支持标准H5 WebRTC推播 , 在千万级并发情况下延时可以控制在1s以内;RTC端到端延时可以控制在250ms左右 。
GRTN架构下图是一个传统互动直播系统的典型架构 , 这个架构的特点是:

  • 树状层级结构
  • 上行推流主流协议:RTMP/WebRTC
  • 下行播放的主流协议: HTTPFLV/ RTMP/HLS
  • 直播分发和RTC推流系统分离
  • 端到端延时~6s

2020双十一,阿里云GRTN拉开直播和RTC技术下半场序幕文章插图
传统架构的主要缺点是:
  • 成本高 , 主要是媒体数据经过的链路长、直播分发和RTC推流系统孤立
  • 延时大 , 因为采用的基于TCP的RTMP/HTTP-FLV协议 , 而且媒体数据经过的链路长
  • 扩展难 , 由于RTMP/HTTP-FLV协议在传输上不是全双工的 , 所以业务形态是只能支持单向直播 , 视频互动需要借助旁路的连麦系统 。
相比于传统的直播架构 , GRTN架构的技术特点是:
  • 混合组网:树状层级结构+对等图形网
  • 能力下沉:协议边缘卸载+内部传输协议归一化
  • 控制和数据分离:动态路径规划+全分布式SFU

2020双十一,阿里云GRTN拉开直播和RTC技术下半场序幕文章插图
架构升级所带来的核心价值是: