性能文章>聚焦|用技术保障企业业务连续性,混沌工程实验室杭州站主题沙龙圆满落幕!>

聚焦|用技术保障企业业务连续性,混沌工程实验室杭州站主题沙龙圆满落幕!原创

2年前
139200

在数字经济快速稳定发展背景下,云计算已经成为企业数字化转型的基石。
 
应用层追求更全面、更便利、更快捷的服务,逆向推动技术层面系统越来越庞大,持续维护系统的难度与日俱增,故障的发生不可避免,如何保障业务持续的高可用性和稳定性成为了大家面临的挑战!
 

01  前言
在稳定性保障能力建设方面,互联网公司的思考及实践已较为深入,从混沌工程到可观测性,从全链路压测到应用多活。相对而言大部分国内传统企业还处于大型机到分布式、云原生化改造的阶段,对稳定性保障能力建设的路径、障碍并不清晰,对稳定性保障技术价值仍不明。
为指导传统企业更好、更快的建设系统稳定性能力,5月28日由混沌工程实验室主办,阿里云、PerfMa联合承办的《混沌工程杭州线下沙龙分享会》在杭州奥克斯皇冠假日酒店圆满落幕。
 
本次沙龙围绕着“如何保障传统企业系统稳定性”的话题进行深入探讨,邀请了多位行业内稳定性专家进行精彩分享,吸引了优秀精英共同参与探讨,分享了对于IT系统稳定性差异的多维度思考。
 
 
中国信息通信研究院云计算与大数据研究所副总工程师 陈屹力,在本场沙龙开场致辞时表示:
 
云计算的快速发展和企业加速上云,让稳定性成为企业发展的重要保障,本次沙龙联动上下游企业期望共同推进系统稳定性保障的概念普及以及行业应用实践落地,提升业务联系性,促进业务高质量发展。
 
致辞结束时,陈屹力表示本次沙龙的联合承办方PerfMa对混沌工程发展做出了杰出贡献,并授予混沌工程实验室副理事长单位证书。
02  专家分享
云服务稳定运行是企业发展的基石,稳定性保障能力建设是一套体系性工程,如何开展全方位设计、建设工作呢?
 
为此本场沙龙特邀 - 中国信息通信研究院云计算与大数据研究所云计算部副主任 郑立为大家讲解关于信通院“稳定性保障计划”的最新规划和深度解读
「注:中国信通院于2022年3月初发起“系统稳定性保障计划”,依托于混沌工程实验室输出系列标准及报告成果,并开展一系列云系统稳定性能力建设推进活动」
 

郑老师在演讲中介绍了混沌工程的概念以及混沌工程实验室在推动系统稳定性提升方面所作的工作,同时分析了系统稳定性保障工作的价值,并详细解读了“稳保计划”的细节。“稳保计划”以保障企业系统稳定性、提升数字化业务连续性、促进业务高质量发展为目标,在业务的不同阶段设置了安全生产计划、稳定性体检工程、稳定性测试组、稳定性守护者成员、系统稳定性度量评估环节,全方位推进企业系统稳定性能力建设。

金融是离数字化最近的行业,也是体量最大、最容易产生倍增效益的行业,金融行业对于业务的稳定运行有着天然的敏锐性,因此PerfMa也邀请了中国工商银行软件开发中心的吴冕冠老师,同大家分享银行业在系统稳定性建设方面的探索实践,以及金融领域如何进行系统稳定性建设的思考。
 

吴老师在演讲中表示为了更好的应对业务快速增长,银行业也开展了分布式架构的转型,并探索如何通过科学的方式建立稳定性保障体系,以应对业务快速增长和架构转型过程中的稳定性挑战。随后吴老师给大家展示了工商银行在稳定性建设的相关实践,从项目前、项目中、项目后三个阶段采取全方位的故障预防、故障发现&分析、故障处理等系统稳定相关建设,供大家学习参考。

究竟如何才能让不同行业的企业,按需落地混沌工程,充分发挥混沌工程的价值?阿里巴巴技术专家 肖长军先生以多年深耕混沌工程领域的独到见解做了深度解读。
 

肖老师提到混沌工程已经成为企业保障系统稳定性的重要手段,但随之企业在落地混沌工程过程中也面临着很多困难。详细介绍了基于阿里巴巴混沌工程十年的实践经验沉淀的一套体系建设方案。基于此体系方案,采用专家咨询服务和企业级技术平台模式输出,解决企业在落地混沌工程中的难题,快速实现混沌工程落地可行性评估、规模化落地和行业深度共建目标。

针对可靠性测试的挑战,混沌工程在一定程度上给出了解法,但如何运用平台的工具进行可靠性测试实践?为此我们邀请了PerfMa混沌工程产品负责人叶青山先生带来了案例解读和实践工具演练。
 

叶老师的演讲分别从可靠性问题分析、可靠性测试方案、寻找可靠性分母、构建可靠性用例、可靠性用例执行、可靠性测试应用场景六个环节,全方位给大家演示如何推进企业系统稳定性能力建设。

PerfMa特别邀请了杭州微智测信息技术服务有限公司CEO 丁国富先生,对OS等复杂软件的稳定性系统做保障方案的解析分享。
 

丁老师以云计算底座之一OS面临的测试挑战为切入点,从稳定性的关键要素:软件的可靠性、业务的延续性两方面展开。重点介绍了通过人工故障注入、自动随机探索(混沌工程)、再到智能化测试全面覆盖,三重措施逐步增强复杂软件的稳定性。

03  圆桌交流
随着企业开始加速布局混沌工程,应该如何看待未来系统稳定性等发展 ,如何更好更快等体系化建挖掘混沌工程等价值去发展IT系统的稳定性?
 
混沌工程、全链路压测、可观测性可谓稳定性能力保障的铁三角,对于传统行业来讲,如何有效综合运用以上技术来做好稳定性保障工作?专家们就这些问题在圆桌互动交流时思维碰撞金句频现。
 
与会专家在交流中也表示,混沌工程经过多年的发展从技术的角度来讲,行业内已经有了一些通用的混沌工程实验解决方案供企业选择,本次被授任为混沌工程实验室副理事长的PerfMa在此领域拥有卓越领先的技术实力和丰富的行业经验 (注:其余副理事长单位是BAT、华为等)。
 
PerfMa专注系统稳定性保障,是全国系统稳定性领域内表现优益的科技公司之一,先后获得高瓴、嘉御等多家投资机构上亿元的融资,针对企业在IT性能领域的难题,PerfMa提供了从社区到产品、再到服务的一站式IT系统稳定性保障解决方案,服务了太平洋保险、国泰君安、招商银行、恒生电子、南方电网、翼支付、爱马仕等上百家各行业头部知名企业并获得了广泛的市场赞誉。
 
结语
本次沙龙聚焦了如何保障传统企业IT系统稳定性,从需求方、建设方双方的视角共同探讨了传统行业IT系统稳定性的发展新思路,PerfMa将继续在通信院的指导下,围绕混沌工程的行业动态,通过不定期举办沙龙的形式,为行业企业提供更加灵活多样的交流机会,更好地服务企业,服务社会!

 

点赞收藏
大白
请先登录,感受更多精彩内容
快去登录吧,你将获得
  • 浏览更多精彩评论
  • 和开发者讨论交流,共同进步
0
0