性能文章>谈谈指令重排>

谈谈指令重排原创

5083345

哈喽,我是子牙。十余年技术生涯,一路披荆斩棘从技术小白到技术总监到JVM专家到创业。技术栈如汇编、C语言、C++、Windows内核、Linux内核。特别喜欢研究虚拟机底层实现,对JVM有深入研究。分享的文章偏硬核,很硬的那种。

 

手撸过JVM、内存池、垃圾回收算法、synchronized、线程池、NIO…

 

 

这个知识点也是很多人说不清道不明的地方,感觉都知道,说又说不出来。为什么会这样呢?因为这几个字,很容易被当成动词去理解,其实正确的理解是当成名词,即指令重排现象。那什么时候会产生指令重排现象呢?两个阶段:1、编译期;2、运行期。

 

编译期指令重排

 

解释型语言是在运行期间执行编译+运行动作,所以运行效率较编译型语言低。Java既可以作为解释型语言去用,也可以作为编译型语言。但是主流的做法是当成编译型语言在用。那Java在编译期做了指令重排优化吗?做了哪些优化?能不能让我看看?为了满足大家的好奇,安排。

 

这里先解释下编译期:像c/c++只有一个编译期,就是调用gcc命令将c/c++代码编译成汇编代码。但是Java中有两个编译期:1、调用javac命令将Java代码编译成Java字节码;2、Unix派系平台上调用gcc命令将openjdk源码编译成汇编代码。网上所有的文章都是在讲第一种,而且都是讲概念,以讹传讹。我这篇文章不仅两种都讲,还都用代码+图片的方式证明给你看。所以想学底层,不找一个靠谱的师傅是学不会学不明白的,因为第一你不知道这个知识点牵扯得有多深,第二两个观点摆在你面前,你不知道哪个对那个错。

 

这里我先把结论给大家吧:编译期间,Java中所谓的指令重排主要是说编译openjdk时的指令重排,将Java代码编译成Java字节码是没有做指令重排的。即你加不加volatile,生成的字节码文件是一样的。是不是颠覆了你对这块的认知呢!不信?看案例。

 

可能有人要问了,如果加不加volatile生成的字节码文件都一个样,那在运行的时候JVM是怎么知道的呢?类属性在JVM中存储的时候会有一个属性:Access flags。JVM在运行的时候就是通过该属性来判断操作的类属性有没有加volatile修饰,上图。

 

 

1、上神秘代码

public class Test3 {
public static /* volatile */ int found = 0;
public static void main(String[] args) {    new Thread(new Runnable() {       public void run() {          System.out.println("等基友送笔来...");
         while (0 == found) {          }
         System.out.println("笔来了,开始写字...");       }    }, "我线程").start();
   new Thread(new Runnable() {       public void run() {          try {             Thread.sleep(2000);          } catch (InterruptedException e) {             e.printStackTrace();          }
         System.out.println("基友找到笔了,送过去...");
         change();       }    }, "基友线程").start(); }
public static void change() {    found = 1; }}

 

稍微解释下这段代码:有两个线程:我线程、基友线程。『我线程』通过死循环阻塞在那里等待『基友线程』找到笔送过来,然后开始写字。『基友线程』等待一会就去找笔,找到了就送过去。

 

2、编译成Java字节码(没加volatile)

 

3、编译成Java字节码(加了volatile)

 

可以发现加不加volatile,生成的字节码是一样的。

 

4、编译器优化

 

指令重排是编译器优化中的一种,编译openjdk是启用了O2级编译器优化,如图。

 

 

O2级优化做了哪些优化?比如优化无效代码、编译期完成简单运算、处理编译期屏障……那gcc有多少级优化?有兴趣的童鞋可以自行学习,百度搜索关键词:-O2。

 

优化无效代码,看图(我就不贴C++代码了)

 

 

运行期指令重排

 

不知道大家有没有听过一个词:CPU乱序执行。乱序执行是相对于顺序执行来说的。计算机刚被发明的时候都是顺序执行,后来为了提升CPU运行效率,升级成了乱序执行。那为什么乱序执行就提高了运行效率呢?有兴趣的童鞋可以去研究下,关键词:指令流水线。所以计算机这行,如果你觉得大学学的那些基础知识不重要,你看我的文章就明白有多重要。这行走到最后较量的就是这些东西,就是看谁研究得更深入更底层更明了。

 

因为现在的CPU都是采用乱序执行,这样在运行程序的过程中就带来了指令重排的现象。这是在运行期,在CPU内部发生的,我就没办法证明给你看了。但就算是乱序执行提高了效率,那也不能改变我程序的意愿,这就引出了一个概念:as-if-serial。

 

何谓as-if-serial呢?简单的说就是不管你在编译期或者在运行期怎么做指令重排,单线程环境下程序的执行结果不能改变。说白了这是指令重排的底线,是必须遵守的规范。那如何保证呢?这就引出了另外两个难以理解的知识点:happens-before、内存屏障。

 

happens-before是做什么的呢?简单的说就是告诉写JVM的人,你写JVM的时候要遵循这几条规则,这几条规则是你JVM默认要做到的,而不用程序猿在写代码的时候需要去想去做控制。比如对象的初始化动作一定要先于finalize方法执行前完成。其他几个规则我就不细说了,都很好理解,童鞋们自行去学习下。

 

有些流程的顺序是可以提前知晓并确定下来,但有些流程的顺序是无法提前知晓的,比如你公司的业务,写JVM的人肯定不知道,所以依然需要程序猿根据业务需要来控制,那从JVM层面来说,我给你提供机制。内存屏障就是这种机制中的一种,其他的还有各种锁。关于内存屏障,我之前已经写了一篇文章深入讲解了这块,有兴趣的同学可以去看看。传送门

 

 

 

你好,我是子牙。十余年技术生涯,一路披荆斩棘从小白到技术总监到大厂中间件到创业。技术栈如汇编、C语言、C++、Windows内核、Linux内核及特别喜欢研究虚拟机底层实现,对JVM有深入研究。分享的文章偏硬核,很硬的那种。不考虑交个朋友吗?关注硬核子牙

 

点赞收藏
分类:标签:
子牙_公号硬核子牙

对编程语言的设计与实现有浓厚兴趣。聚焦Hotspot源码、Linux内核研究,硬核干货分享

请先登录,查看3条精彩评论吧
快去登录吧,你将获得
  • 浏览更多精彩评论
  • 和开发者讨论交流,共同进步

为你推荐

从 Linux 内核角度探秘 JDK MappedByteBuffer

从 Linux 内核角度探秘 JDK MappedByteBuffer

MappedByteBuffer VS FileChannel:从内核层面对比两者的性能差异

MappedByteBuffer VS FileChannel:从内核层面对比两者的性能差异

45
3