不会JVM调优怎么进互联网大厂原创
如果说有什么在面试中经常被问到,但是在实际工作中又不经常用到的Java技术,那么JVM调优绝对可以排得上号。每当有同学被问到这个问题的时候,内心的OS大概是这样:我一个QPS几百的系统,有啥好调优的,默认配置用用得了,调JVM参数整不好系统还能干崩了,想想好像是这么个道理。但是对于一些高并发大流量业务场景,JVM调优就有用武之地了。因此个人觉得JVM调优也许不像SQL调优或者代码优化在工作中使用得那么频繁,甚至很多时候其实是用不上的,但是在需要用到的时候如果你能顶得住压力完成优化,那么你和其他人的不同就显现出来了。另外如果我们想进入一线互联网大厂,那么JVM调优就是必须要掌握的重要技能。
预估比调优更重要
为什么需要进行预估
所谓凡事预则立不预则废,对于JVM调优来说也是如此。无论修改线上已有JVM参数配置还是优化代码实际都是一种无奈之举,因为生产环境出现了运行异常不得不采用这种方式进行优化,从而保障线上应用服务能够正常运行,否则就要拉程序员出来祭天了。但是如果我们在服务发布部署之前可以预估服务的容量而后进行对应的JVM参数配置,那么就相当于把可能出现的JVM异常扼杀在摇篮中。当然这是最理想的状态,在现实中也实际不容易做到,但是即便我们不能预估的那么准确,也总比不做容量预估直接裸奔上线的好。因此关于JVM调优这件事情,实际和《孙子兵法》的核心思想有异曲同工之妙,上兵伐谋,其次伐交,其次伐兵,其下攻城。也就是说JVM调优最高境界是预估不调,打仗最高境界是不战而胜。
如何进行预估
在明确了JVM参数预估对于生产环境中服务稳定运行的意义之后,我们一起看下如何进行JVM参数预估。首先我们应该先分析下自己系统的核心业务流程是什么,然后根据核心业务流程结合线上可能的流量,确认好我们核心业务代码中的对象创建以及销毁情况是怎样的,最后再针对性的进行相关JVM参数的预估配置。因此JVM参数预估的地址基本流程如下所示:
Array Length:如果当前对象是一个数组对象那么此处存储的就是数组的大小,占用4个字节,如果不是数组对象那么就不占用。
但是考虑到电商平台存在大促场景,这个时候的流量可能是平时的好几倍,因此我们实际上需要将堆内存中的年轻代进行放大,Eden区可以到1.6G,Survivor区可以各自200M。这样可以避免由于年轻代空间不足导致对象提前进入老年代而造成fullGC的频率变高,从而影响服务的稳定性。
JVM调优思路JVM
理想情况下预估的JVM参数应该可以cover线上的业务场景,但是假如公司业务发展飞快,业务体量迅速膨胀,原先预估的JVM配置参数可就不一定能满足线上生产环境所有情况,因此异常情况还是会出现。这里将JVM异常主要分为两类,一种是代码导致的JVM异常,另一种是JVM不合理配置导致的异常,包括JVM参数以及服务器内存配置。
(1)如下图的例子,客户端和服务端建立了websocket连接,如果连接未正常建立,又重新建立连接如果此时服务端未将连接关闭,那么就会导致重新使用新的请求对象,随着时间的累计JVM中出现大量对象来不及回收,导致JVM无法分配新的内存空间给服务中新产生的对象,最终导致JVM内存溢出。由于JVM中堆积了几千个RequestIInfo对象,同时服务还在不断产生新的RequestInfo对象,最终不可避免地就会发生OutOfMemoryError异常。通过MAT我们可以轻松定位到发生内存溢出的代码位置,搞清楚为什么会有RequestInfo对象被创建之后,我们就可以进行针对性的优化了。
(2)我们在实际项目开发的过程中必定会涉及到业务数据的查询,假如没有控制好数据查询的条件或者说本身查询的数据量就很大。那么就容易造成一次性查询大量数据,这些数据如果全部load到内存中就很容易导致内存溢出。所以一般涉及到数据查询的代码要做好相应的处理,分页查询也好,限制查询数据量也好或者流式查询也好,总之不能一次性将大量数据加载到内存中。
(3)在for循环或者while循环中大量创建对象,最终导致对象在对堆内存中堆积,这种是由于条件没有控制好条件导致对象被不断创建。
当我们知道了这些常见的可能导致JVM异常的代码结构之后,那么在平常做项目编写代码的时候就要时刻保持警惕。写完代码之后自己再回头看看这段代码的对象创建情况是怎样的,有没有大对象缓存,有没有不合理的while循环for循环,会不会有可能造成JVM内存溢出。当我们有了这样反观代码的意识之后,从根本上JVM内存溢出的概率大大降低,有益于线上服务的稳定性。
JVM参数不合理导致的异常
通过上文我们可以明确无论是优化业务代码还是参数调优,其实都是在避免在堆中遗留过多的对象。可以看得出来,JVM调优的本质思想其实就是生产者-消费者模型,为什么这么说呢?你看一方面随着平台业务的不断进行,JVM中会不断产生对象,那么平台就相当于对象生产者。另一方面垃圾回收器这个勤劳的小蜜蜂在不断检测哪些对象已经是垃圾对象,然后根据策略进行垃圾回收释放内存空间,那么JVM就相当于对象消费者。一个生产对象,一个消费对象,这可不就是生产者消费者模型嘛。所以从这个角度来看,生产者和消费者的动态平衡才能保证JVM的正常运行,如果对象生产地快,而对象回收地慢就会导致内存溢出等JVM异常。所以JVM调优从本质上来说,就是通过各种手段构建对象生产与回收的动态平衡。
JVM常见配置参数
无论是发布部署前的JVM参数预估还是异常过后的参数优化,都是需要通过调节JVM对应的参数来完成的,因此我们需要掌握常用JVM参数项及其含义。
配置项 | 含义 |
-Xms |
初始堆大小 |
-Xmx | 初始堆最大值 |
-Xmn | 堆中新生代最大值 |
-XX:SurvivorRatio | survivor区与Eden区的比例 |
-XX:NewRatio | 新生代和老年代的比例 |
-XX:MetaspaceSize | 初始元空间大小 |
-XX:MaxMetaspaceSize | 元空间最大大小 |
-Xss | 线程虚拟机栈大小 |
-XX:+HeapDumpOnOutOfMemoryError | 开启内存溢出时进行内存快照 |
-XX:HeapDumpPath=/data/dump/jvm.hprof | 内存快照文件路径 |
JVM常见垃圾回收器
随着JDK版本的不断迭代,垃圾回收器同样也在不断迭代优化。当然不同的业务场景,我们可以选择不同的垃圾回收器来进行应对,而垃圾回收器也在向着回收效率高、停顿时间短的目标不断进行调整改进。
垃圾回收器 | 引入版本 | 特点 | 适用场景 |
Serial GC |
JDK3 |
单线程方式进行垃圾回收,暂停所有应用线程 |
适用于小型应用,单CPU的系统或者不需要高并发的场景 |
ParNew GC |
JDK3 | Serial GC多线程实现 | 年轻代垃圾回收 |
Parallel GC |
JDK4 |
利用多CPU、多核心的系统资源,提高垃圾回收效率 |
对吞吐量有要求的应用场景,如数据处理、科学计算等 |
CMS GC |
JDK5 |
采用多线程方式进行垃圾回收,能够缩短应用程序的暂停时间 |
适用于对响应时间有要求的应用场景 |
G1 GC |
JDK7 |
内存划分为一个个Region,可以指定停顿时间 |
适用于部署早多核CPU大内存机器上的大型应用,对停顿时间有一定要求, |
ZGC | JDK11 | 支持超大堆空间,最大停顿时间不超过10ms | 业务对于停顿时间低于100ms |
总结
任何技术上的优化都是建立在对技术原理的深刻理解基础之上的,JVM调优亦是如此。文章中常见的JVM调优手段只不过是一些术,搞懂JVM的运行原理以及垃圾回收机制才是关键。另外在调优前我们得先搞清楚我们调优的目标是什么,有了目标的指引,我们才能做到有的放矢。其实无论是性能优化还是业务优化其实都是有一定的规律可以摸索,万变不离其宗,都是通过观:观察当前是个什么样的状态;析:分析整条业务链路找到可以优化的方向以及改造点;优:动手制定优化策略以及验证方法进行优化实操。
关注公众号:慕枫技术笔记,可以和博主沟通交流考研、简历优化、技术面试