【8】性能测试平台从设计到实现-运维监控指标的解读原创
2年前
5073129
今天是2021年的最后一天,以运维指标解读为今年的连载画个句号~
之前的两篇我们主要是针对压测引擎提供的报告进行解读,同时我们也应关注运维监控工具提供的指标,多方面来对本次任务进行评估。由于我们的压力机和被测服务都是部署在云平台的容器中,所以我们直接消费云平台侧提供的数据,进行聚合绘图,不重复去造轮子~先来看个图
我们的监控报告按照被测服务和施压服务进行拆分。首先是被测服务,我们以图形化的方式将服务维度的访问量和QPS、平均响应时间、异常次数、FGC进行展示。
然后将接口及集群维度的指标以表格的形式进行展示。并获取压测前5min的指标来进行对比
再来看下施压服务的监控指标结果
文中提到的硬件和服务维度的指标,都是常用指标,那这些指标又如何与告警阈值,弹性扩容阈值,服务健康度评分等关联呢?等元旦回来我们再来讲~
点赞收藏
分类: