性能文章>谈谈指令重排>

谈谈指令重排原创

2388042

哈喽,我是子牙。十余年技术生涯,一路披荆斩棘从技术小白到技术总监到JVM专家到创业。技术栈如汇编、C语言、C++、Windows内核、Linux内核。特别喜欢研究虚拟机底层实现,对JVM有深入研究。分享的文章偏硬核,很硬的那种。

 

手撸过JVM、内存池、垃圾回收算法、synchronized、线程池、NIO…

 

 

这个知识点也是很多人说不清道不明的地方,感觉都知道,说又说不出来。为什么会这样呢?因为这几个字,很容易被当成动词去理解,其实正确的理解是当成名词,即指令重排现象。那什么时候会产生指令重排现象呢?两个阶段:1、编译期;2、运行期。

 

编译期指令重排

 

解释型语言是在运行期间执行编译+运行动作,所以运行效率较编译型语言低。Java既可以作为解释型语言去用,也可以作为编译型语言。但是主流的做法是当成编译型语言在用。那Java在编译期做了指令重排优化吗?做了哪些优化?能不能让我看看?为了满足大家的好奇,安排。

 

这里先解释下编译期:像c/c++只有一个编译期,就是调用gcc命令将c/c++代码编译成汇编代码。但是Java中有两个编译期:1、调用javac命令将Java代码编译成Java字节码;2、Unix派系平台上调用gcc命令将openjdk源码编译成汇编代码。网上所有的文章都是在讲第一种,而且都是讲概念,以讹传讹。我这篇文章不仅两种都讲,还都用代码+图片的方式证明给你看。所以想学底层,不找一个靠谱的师傅是学不会学不明白的,因为第一你不知道这个知识点牵扯得有多深,第二两个观点摆在你面前,你不知道哪个对那个错。

 

这里我先把结论给大家吧:编译期间,Java中所谓的指令重排主要是说编译openjdk时的指令重排,将Java代码编译成Java字节码是没有做指令重排的。即你加不加volatile,生成的字节码文件是一样的。是不是颠覆了你对这块的认知呢!不信?看案例。

 

可能有人要问了,如果加不加volatile生成的字节码文件都一个样,那在运行的时候JVM是怎么知道的呢?类属性在JVM中存储的时候会有一个属性:Access flags。JVM在运行的时候就是通过该属性来判断操作的类属性有没有加volatile修饰,上图。

 

 

1、上神秘代码

public class Test3 {
public static /* volatile */ int found = 0;
public static void main(String[] args) {    new Thread(new Runnable() {       public void run() {          System.out.println("等基友送笔来...");
         while (0 == found) {          }
         System.out.println("笔来了,开始写字...");       }    }, "我线程").start();
   new Thread(new Runnable() {       public void run() {          try {             Thread.sleep(2000);          } catch (InterruptedException e) {             e.printStackTrace();          }
         System.out.println("基友找到笔了,送过去...");
         change();       }    }, "基友线程").start(); }
public static void change() {    found = 1; }}

 

稍微解释下这段代码:有两个线程:我线程、基友线程。『我线程』通过死循环阻塞在那里等待『基友线程』找到笔送过来,然后开始写字。『基友线程』等待一会就去找笔,找到了就送过去。

 

2、编译成Java字节码(没加volatile)

 

3、编译成Java字节码(加了volatile)

 

可以发现加不加volatile,生成的字节码是一样的。

 

4、编译器优化

 

指令重排是编译器优化中的一种,编译openjdk是启用了O2级编译器优化,如图。

 

 

O2级优化做了哪些优化?比如优化无效代码、编译期完成简单运算、处理编译期屏障……那gcc有多少级优化?有兴趣的童鞋可以自行学习,百度搜索关键词:-O2。

 

优化无效代码,看图(我就不贴C++代码了)

 

 

运行期指令重排

 

不知道大家有没有听过一个词:CPU乱序执行。乱序执行是相对于顺序执行来说的。计算机刚被发明的时候都是顺序执行,后来为了提升CPU运行效率,升级成了乱序执行。那为什么乱序执行就提高了运行效率呢?有兴趣的童鞋可以去研究下,关键词:指令流水线。所以计算机这行,如果你觉得大学学的那些基础知识不重要,你看我的文章就明白有多重要。这行走到最后较量的就是这些东西,就是看谁研究得更深入更底层更明了。

 

因为现在的CPU都是采用乱序执行,这样在运行程序的过程中就带来了指令重排的现象。这是在运行期,在CPU内部发生的,我就没办法证明给你看了。但就算是乱序执行提高了效率,那也不能改变我程序的意愿,这就引出了一个概念:as-if-serial。

 

何谓as-if-serial呢?简单的说就是不管你在编译期或者在运行期怎么做指令重排,单线程环境下程序的执行结果不能改变。说白了这是指令重排的底线,是必须遵守的规范。那如何保证呢?这就引出了另外两个难以理解的知识点:happens-before、内存屏障。

 

happens-before是做什么的呢?简单的说就是告诉写JVM的人,你写JVM的时候要遵循这几条规则,这几条规则是你JVM默认要做到的,而不用程序猿在写代码的时候需要去想去做控制。比如对象的初始化动作一定要先于finalize方法执行前完成。其他几个规则我就不细说了,都很好理解,童鞋们自行去学习下。

 

有些流程的顺序是可以提前知晓并确定下来,但有些流程的顺序是无法提前知晓的,比如你公司的业务,写JVM的人肯定不知道,所以依然需要程序猿根据业务需要来控制,那从JVM层面来说,我给你提供机制。内存屏障就是这种机制中的一种,其他的还有各种锁。关于内存屏障,我之前已经写了一篇文章深入讲解了这块,有兴趣的同学可以去看看。传送门

 

 

 

你好,我是子牙。十余年技术生涯,一路披荆斩棘从小白到技术总监到大厂中间件到创业。技术栈如汇编、C语言、C++、Windows内核、Linux内核及特别喜欢研究虚拟机底层实现,对JVM有深入研究。分享的文章偏硬核,很硬的那种。不考虑交个朋友吗?关注硬核子牙

 

分类:
标签:
请先登录,再评论

暂无回复,快来写下第一个回复吧~

为你推荐

不起眼,但是足以让你有收获的JVM内存分析案例
分析 这个问题说白了,就是说有些int[]对象不知道是哪里来的,于是我拿他的例子跑了跑,好像还真有这么回事。点该 dump 文件详情,查看相关的 int[] 数组,点该对象的“被引用对象”,发现所
从一起GC血案谈到反射原理
前言 首先回答一下提问者的问题。这主要是由于存在大量反射而产生的临时类加载器和 ASM 临时生成的类,这些类会被保留在 Metaspace,一旦 Metaspace 即将满的时候,就会触发 Fu
关于内存溢出,咱再聊点有意思的?
概述 上篇文章讲了JVM在GC上的一个设计缺陷,揪出一个导致GC慢慢变长的JVM设计缺陷,可能有不少人还是没怎么看明白的,今天准备讲的大家应该都很容易看明白 本文其实很犹豫写不写,因为感觉没有
协助美团kafka团队定位到的一个JVM Crash问题
概述 有挺长一段时间没写技术文章了,正好这两天美团kafka团队有位小伙伴加了我微信,然后咨询了一个JVM crash的问题,大家对crash的问题都比较无奈,因为没有现场,信息量不多,碰到这类问题我
又发现一个导致JVM物理内存消耗大的Bug(已提交Patch)
概述 最近我们公司在帮一个客户查一个JVM的问题(JDK1.8.0_191-b12),发现一个系统老是被OS Kill掉,是内存泄露导致的。在查的过程中,阴差阳错地发现了JVM另外的一个Bug。这个B
JVM实战:优化我的IDEA GC
IDEA是个好东西,可以说是地球上最好的Java开发工具,但是偶尔也会卡顿,仔细想想IDEA也是Java开发的,会不会和GC有关,于是就有了接下来对IDEA的GC进行调优 IDEA默认JVM参数: -
不起眼,但是足以让你收获的JVM内存案例
今天的这个案例我觉得应该会让你涨姿势吧,不管你对JVM有多熟悉,看到这篇文章,应该还是会有点小惊讶的,不过我觉得这个案例我分享出来,是想表达不管多么奇怪的现象请一定要追究下去,会让你慢慢变得强大起来,
如何通过反射获得方法的真实参数名(以及扩展研究)
前段时间,在做一个小的工程时,遇到了需要通过反射获得方法真实参数名的场景,在这里我遇到了一些小小的问题,后来在部门老大的指导下,我解决了这个问题。通过解决这个问题,附带着我了解到了很多新的知识,我觉得