《全链路压测技术发展指南》2022重磅发布!原创
近期,由PerfMa撰写的《全链路压测技术发展指南》正式发布。该白皮书从稳定性行业视角切入,基于PerfMa多年在压测领域的经验沉淀进行撰写。
本文将分别以下4点进行详尽的分析讲解:
-
全链路压测相关技术行业发展时间线
-
全链路压测阶段技术落地
-
PerfMa在全链路压测领域所做出的贡献
-
PerfMa产品特性及实践案例描述
全链路压测行业发展
全链路压测技术,最早是在 2014 年阿里巴巴双 11 大促活动保障背景下被提出,阿里巴巴于 2009年开始双 11 节点促销活动,为稳定有序的开展节点式的双11活动,整个阿里的业务团队、研发测试团队及运维保障团队前前后后需要投入大半年的时间。
即使准备的如此充分,大促还是会出现个别关键链路系统出问题的情况,而大促消费本身就是偏冲动消费,因为系统稳定性问题可直接导致交易数量滑坡及部分消费决策终止,如何更加万无一失的确保整个大促活动的平稳落地,支持“丝般顺滑”的购物体验及支付体验,成为活动复盘后团队聚焦急需解决的关键问题。
于是阿里大促保障项目组提出了“全链路压测”的概念,并逐年校正、提升、修正、打磨该体系,目前已成为阿里集团业务稳定性保障的基础能力。
全链路压测不仅仅是一项专业技术,更是系统稳定保障的重要抓手,通过该技术的推广可以有机的把业务团队、研发测试团队和运维保障团队有效的链接起来,从大促压测逐步演进到常态压测,为企业业务稳定性发展保驾护航。
全链路压测阶段技术落地
全链路压测技术在传统企业的应用,目前可以认为基本是业界在面对微服务敏捷迭代效率及容量诉求下性能测试体系全面升级的关键手段,其整个技术在企业的落地可以分为如下几个阶段:
对于已经开展微服务架构中大型企业,建议通过将线下全链路压测技术的性能体系作为测试体系完善的重要环节。微服务架构随着企业业务的快速发展,其架构发展的必经之路是应用膨胀,与传统的性能测试方案和架构发展并不匹配,主要体现在:
-
代码迭代效率快,业务代码变更广
-
系统容量评估手段有限、成本高
-
难以定位性能瓶颈,需要多面协作
线上全链路压测开展
全链路压测技术,本就来源于生产压测的背景,其开展的思路也主要是线下压测在环境仿真复杂度及压测模型准确性带来的限制问题。在风险可控以及大规模的环境复杂度挑战较高的背景下,线上全链路压测是确保系统容量和性能瓶颈发现的较好手段,其关键技术点为:
PerfMa在全链路压测领域贡献
PerfMa 作为全链路压测领域的头部服务商,专注于软件创新研发工具的开拓、测试体系的构建及稳定性保障解决方案提供,致力于帮助百万企业提高IT系统建设和保障的能效、 降低成本,为企业数字化转型及持续发展保驾护航,其全链路压测产品 XSea 及解决方案已覆盖银行、证券、保险、新零售、航司等多个关键行业领域的头部客户,为数千个技术团队提供 24 小时不间断服务。
截至目前该产品已经迭代了4个大的版本,2022年推出了4.x系列,该版本在系统扩展性、易用性较之前的版本都有较大程度的提升,并支持不同产品模块发压、监控、分析和第三方平台的集成和使用,便于更好的融入客户的业务体系,同时该版本已通过中国信息通信研究(以下简称“中国信通院”)2022年首批全链路压测“先进级”能力评估。
PerfMa实践案例描述
-
项目背景
该客户是一家外企独资企业,其在国内大部分一线及部分二级城市都有直营店。随着业务规模的不断壮大增加,业务方活动次数增大,今年大型促销活动几乎达到每月一次,对全链路压测的需求也越来越高。公司在整个IT服务涉及多方团队支持,各个不同团队比较关注自身系统的单场景测试,在做全链路压测过程困难重重,一方面是没有完整的性能测试环境,另一方面各团队有自己的规范,沟通协调成本极高。面对公司不断发展的业务,靠增加测试环境资源只能是一种治标不治本的办法,并且维护成本也一直会高居不下,更为重要的是测试环境的维护工作又是很重的任务,测试环境不稳定必然会大大的影响正常的性能测试进度,影响活动的指标评估,给企业的效益造成很大的损失。
-
应对解决方案
为了适应与满足企业现有性能测试的现状,顺应公司业务发展而带来新的变化, PerfMa 提出线上生产压测和线下系统压测结合的综合策略,我们在生产环境验证做开端,逐步做测试环境建设。生产环境上,对主业务活动做容量评估,通过生产压测的价值驱动线下全链路体系提升。 配合模式上,由企业 QA 部门或运维团队牵头,基于多方协作规范,构建虚拟团队,自上而下构建全链路压测体系共建意识,规范压测流程中各个阶段的准入准出文档,减少各团队无效沟通,配合当前发布周期下的质量验证,降低由于测试环境验证缺失带来的生产风险。
-
关键实施结果
完成该企业性能测试体系的初步建设,落地协同团队系统验收流程规范,使得系统质量验收从各团队各自验收阶段转变到企业质量保障团队科学验收,落地生产压测规范体系流程,做到每次大促前生产做容量回归,使得生产环境应用质量得到保障。
全链路压测技术作为IT系统稳定性保障的关键手段,虽然已经走过了 7-8 年的年头,但如何更好运用到更多的行业中,还需要各企业深入实践和持续迭代。
保障企业IT系统稳定高效是一项系统化的工程,市场蕴含大量的诉求,赛道足够宽,行业发展尚处于起步阶段,PerfMa 期待在更多的平台和企业进行深入交流,从技术、体系、组织层面一起推进系统稳定性保障工作的升级和持续发展。
扫描下方二维码,获取完整版白皮书