大促场景系统稳定性保障实践经验总结( 三 )
文章插图
6 . 弹性能力
对于有周期性促销活动的用户 , 可以使用Serverless 应用引擎(SAE)快速部署应用 , 利用定时弹性能力 , 在活动开始前自动扩容 , 在活动结束后自动缩容回收资源 , 实现资源利用最大化 , 且整个过程无需人工干预 。
文章插图
四、全链路压测最佳实践经验分享第四位分享嘉宾是阿里云智能解决方案架构师计缘 , 拥有12年IT领域行业经验 , 在能源行业和互联网ToB行业完整经历和实践了SOA架构、微服务架构、云原生架构的转型过程, 对互联网云原生架构以及微服务管理、治理、架构高可用优化有着深入理解 , 实战经验丰富 , 多次帮助阿里云的行业客户对系统架构完成全面的云原生改造 。
文章插图
据计缘介绍 , 大促活动、秒杀活动是最大化流量红利的不二选择 , 但是有很多企业依然享受不到流量红利 , 根本原因只有一个 , 那就是系统支撑不了大流量的冲击 。 主要问题是系统的性能问题大多由不可预知的问题导致 。
整个系统从前到后环节非常多 , 任何一个环节都可能成为整个系统的瓶颈、短板、约束点 。 不同通讯协议 , 不同数据格式 , 不同规范 , 让整个分布式系统架构变得异常复杂 。 另外 , 微服务架构下服务调用链路南北向和东西向都非常长 , 单个服务一旦出问题很容易发生“多米诺骨牌”或“雪崩”效应 。
文章插图
现在大多数产品对于用户而言都是一个入口、一个App , 但其实里面的内容是由多个产品线组合而成的 , 给客户呈现的是由非常多个零件协调组织运转起来的产品 。 但是实际中 , 负责不同模块、不同产品线的小组有自己的测试团队 , 他们只为某一个模块或产品线的质量负责 , 当这些模块组合起来后 , 会产生更多因为各种匹配、协作带来的问题 , 所谓不能窥一斑而知全豹 。 这些不确定的问题给我们产品的用户体验、品牌效应、产品收益带来巨大的挑战 。
我们要解决根本的问题 , 就是要有方案和手段尽可能全的识别这些不确定的因素和问题 。 一个系统在整个运行的生命周期中无外乎两个场景 , 瞬时流量洪峰场景和长期稳态场景 。 **1 . 瞬时流量洪峰场景**
这个场景其实对应的就是大促活动、秒杀活动的场景 , 我们可以在生产环境上做全链路压测 , 最大限度地模拟用户的真实流量 , 不断施压摸高 , 找出系统的性能约束点进行优化;然后反复这个过程 。 在这个过程中有两个关键点 , 一是流量来源近似用户真实流量 , 二是在生产环境上做压测 , 这样等于我们制造出了真实的大促活动场景 , 来发现系统的不确定问题 。
2 . 长期稳态场景
将全链路压测的方案固化 , 通过统一的控制台 , 周期性进行故障演练 , 对版本发布和配置变更后的质量兜底 。 所以通过流量洪峰场景来尽可能多的识别不确定因素 , 通过长期稳态场景常态化监测系统的不确定因素 , 然后分析解决不确定因素 , 达到对系统稳定性和高可用性的优化 。
文章插图
在施压方面 , 阿里云PTS产品基于全国边缘节点、CDN模拟各个地域、各个运营商发起流量 , 能在短时间内发起几十万流量 , 并且可以动态设置地域和运营商 。 在PTS的控制台提供了可视化的方式可以让客户很方便的创建业务场景 , 另外还集成了JMeter原生引擎 , 可以快捷的导入JMeter脚本 , 进行压测工具的无缝迁移 。
在流量隔离方面 , 阿里云提供无侵入的Agent方式 , 在不需要对业务系统做代码改造的同时将流量隔离的能力搭载上去 , 通过在PTS流量管控控制台进行接口Mock规则配置、电子表规则配置、压测数据偏移量配置 , 来实现Agent对压测流量和压测数据的隔离 。
文章插图
总结阿里巴巴目前已经实现全面云原生上云 , 并通过大规模使用包括容器服务ACK、消息队列RocketMQ、微服务 EDAS、监控ARMS、性能测试PTS等在内的云原生产品 , 获得成本、稳定性和研发运维效率提升的红利 。 与此同时 , 双11大促的业务场景也成为阿里云云原生技术与产品优势的锤炼场 , 为阿里云客户创造更大价值 。
- 缩小|调整电脑屏幕文本文字显示大小,系统设置放大缩小DPI图文教程
- Win10系统桌面|手机桌面秒变Win10电脑系统,这波操作太给力了!
- 系统|电子邮箱系统哪家好?邮箱登陆入口是?
- 色卡|双人场景/多机位色彩匹配,色卡很重要
- 车轮旋转|牵引力控制系统是如何工作的?它有什么作用?
- 计算机学科|机器视觉系统是什么
- 系统|vivo系统迎来“大换血”,OriginOS体验报告来了
- 贵阳|捷顺科技(002609.SZ)中标贵阳智慧停车公共信息服务平台系统建设项目
- 输送|新时达:“用于机器人码垛的输送系统”获发明专利
- 共建全场景智慧 释放智数广州新活力