性能文章>学会这个Thread Dump分析工具,让您秒变性能分析大师!>

学会这个Thread Dump分析工具,让您秒变性能分析大师!原创

218503

每次分析thread dump,我都会用肉眼扫描这dump中的线程状态,并企图发现可能存在的死锁,十几万行太难了!有时候记不太清楚各种等待、阻塞的原因,我都偷偷打开一篇博客边看边分析,很明显我还没把原理熟记于心!互联网上讲thread dump的文章太多了,本篇文章也不想讲这个,那么就结合实战讲讲有什么自动分析或可视化分析的工具吧,降低下难度和门槛!

1.实战背景

最近某省项目项目经常出现服务卡死,没法接收数据。该项目对完提供接口,各地市调用接收数据入库。项目架构:jboss5.1,jrockit 1.6, spring mvc。
同事们拿到jboss日志后发现是jboss线程池满了,因此决定调大线程池,代码如下

      <Connector protocol="HTTP/1.1" port="9999" address="${jboss.bind.address}"
               connectionTimeout="20000" redirectPort="${jboss.web.https.port}"
      maxThreads="150" acceptCount="8000"
       />

在设置jboss的参数中,maxThreads(最大线程数)和acceptCount(最大等待线程数)是两个非常重要的指标,直接影响到程序的QPS。
但是治标不治本,运行一段时间后有异常了!

1.1思考

  • 为什么会这样?如果请求数超过了maxThreads(最大线程数)和acceptCount(最大等待线程数),应该拒绝服务,不应该产生卡死呀?

  • 同事准备打开代码加执行时间调试,不知道从何入手。
    那么我们为什么不能从jvm入手,从底层来分析问题,找到性能瓶颈?

1.2来动手吧!

因此我给运维同学说,再次卡死的时候给我提取点线索!然后我把操作手册发给他!

1.2.1 jrockit 线程 dump

1.jps
打开cmd输入jps 找到jboss的进程id例如 11964
2021012521342657.png

2.线程dump
jrcmd.exe 11964 print_threads >d:/threaddump.txt

1.2.2 分析 dump

收到的dump文件足足十几万行,看得眼花缭乱,怎么办呐?**话不多说,上杀手锏!fastthread

2.fastthread简介

Java Thread Dump Analyzer,Troubleshoot JVM crashes, slowdowns, memory leaks, freezes, CPU Spikes。

2.1打开工具,上传dump文件

20210125213442283.png

2.2真相大白

我们可以看到报表给出的潜在风险,相同栈跟踪、频繁调用的方法、cpu占用过高线程、阻塞线程、gc线程、线程堆栈长度、复杂的死锁、死锁、无法有效回收的线程、异常、线程调用栈图、调用树。
20210125213519883.jpg

2.3我的瓶颈所在

大量的http请求,没法从连接池获取链接,进行数据库访问而等待!当等待超过jboss设置的线程数就会报错。因此赶快找到数据库连接池配置增大最大连接数!
20210125213553426.png

2.4最后附上工具地址

https://fastthread.io/
可惜的是该工具免费版使用有限制,下次分享一个国产更强大的工具!

请先登录,感受更多精彩内容
快去登录吧,你将获得
  • 浏览更多精彩评论
  • 和开发者讨论交流,共同进步

为你推荐

从一起GC血案谈到反射原理
前言 首先回答一下提问者的问题。这主要是由于存在大量反射而产生的临时类加载器和 ASM 临时生成的类,这些类会被保留在 Metaspace,一旦 Metaspace 即将满的时候,就会触发 Fu
类初始化导致死锁
一张图简单描述死锁 如上图,Thread1 拿到了 object1,Thread2 拿到了 object2,但是现在 Thread1 需要拿到 object2 的锁才能继续往下,Thread2 又要拿到 object1 才能继续往下
在调试器里看LINUX内核态栈溢出
图灵最先发明了栈,但没有给它取名字。德国人鲍尔也“发明”了栈,取名叫酒窖。澳大利亚人汉布林也“发明”了栈,取名叫弹夹。1959年,戴克斯特拉在度假时想到了Stack这个名字,后来被广泛使用。
使用 FastThread 以及 GCEasy 分别针对线程dump文件以及GC日志文件进行离线分析
概述FastThread 以及 GCEasy分别针对线程dump文件以及GC日志文件的离线分析工作,可快速直观的定位到相关的性能问题。 前置准备 针对目标进程分别生成线程dump文件以及GC日志文件使
学会这个Thread Dump分析工具,让您秒变性能分析大师!
每次分析thread dump,我都会用肉眼扫描这dump中的线程状态,并企图发现可能存在的死锁,十几万行太难了!有时候记不太清楚各种等待、阻塞的原因,我都偷偷打开一篇博客边看边分析,很明显我还没把原
Json 序列化框架导致 CPU 使用率过高
问题现象:CPU 负载过高 我们线上的 jenkins 系统,时不时会发生 CPU 负载过高的现象。 CPU 负载过高后,SRE 同学会收到电话告警。 在我们的监控系统中,可以看到,某些时候,CPU 的负载确实会很高,如下图:
Java线程数过多解决之路——利用Arthas解决Jenkins线程数飙升问题
我们的Jenkins 服务在运行一段时间后,会变得异常卡顿,严重降低持续集成速度,影响研发工作效率。
CPU性能优化基本篇:一定要了解Linux CPU哪些基本概念
实际项目中,我们常常遇到一些CPU高的问题,本次专题由浅入深,从基本概念到线上实践,带着大家重新系统学习一些Linux CPU,Java CPU调优 基本知识和方法。