为什么 JVM 叫做基于栈的 RISC 虚拟机

其实这个问题比较简单，但我今天写这篇文章的主要目的是让大家看一下分析这个问题的逻辑，并且如何更好地从一手资料里寻找这些问题的答案。

上图是《深入理解 Java 虚拟机》一书中的截图。其实，说 JVM 是基于栈的虚拟机，指的是 JVM 所支持的指令集架构 ISA 是基于栈的，即字节码是基于栈的指令集架构。

有了指令集架构这层抽象，我们就无需关心其背后的实现是虚拟机还是物理机，甚至假如实际的执行是基于寄存器实现的，但指令集架构里是基于栈的，我们也可以说这套指令集架构是基于栈的。

------

指令集架构就是 ISA，Instruction Set Architecture。

我们通常使用的 Intel x86 CPU 的 ISA 可以查阅 Intel 手册第二部分。

这里按照首字母排序分成了三个部分进行逐一讲解，一共有几千条指令，所以是属于 CISC 复杂指令集架构。

与之相对的精简指令集架构 RISC 的典型实现是 ARM，ARM 本身的指令集架构又分很多种，其中 A32 ISA 可以从官网下载到，指令数量仅有几百条，且指令长度均为 32 位，方便了指令译码与流水线优化。

而对于 JVM 这台虚拟计算机来说，字节码就是它的 ISA，它的官方手册就是：

Java Language and Virtual Machine Specifications

在 2.11 小节中给出了 ISA 的概述。

在后面的 Chapter 6 中列出了每一条字节码指令的详细说明和用法。

可以注意到，指令的数量非常少，且大部分是零地址指令，即指令长度大部分是固定的 1 字节，所以也是典型的 RISC 指令集架构。

------

字节码指令一共有多少个呢？看下 OpenJDK 源码里的 bytecodes.hpp，共 203 条指令。

而且，还有很多比如 iconst_0 iconst_1 iconst2 ... 这样的，在官方文档中是都归为一类的，所以实际上的指令数量更少，可以放心地把它归为精简指令集的类别里。

好了，我们现在解释清楚了，JVM 为什么是 RISC 指令集架构的虚拟机了。回顾一下我们的思考方式。

Intel x86 --> Intel 手册 --> CISC

ARM -> ARM A32 手册 --> RISC

JVM -> JVM 手册 --> RISC

嗯，完美，接下来我们讨论，为什么 JVM 是基于栈的虚拟机？

------

有两个关键点，一，基于栈说的是 ISA 是基于栈的，即字节码是基于栈的。二，既然说了基于栈，那与之相对的是什么呢？

我们两个问题一块来解释。

我们用 c 语言写一段简单的 1+1 程序。

int add() {
    int a = 1;
    int b = a + 1;
    return b;
}

它编译成 Intel x86 汇编是这样的。

add:
    pushl %ebp
    movl %esp,%ebp
    subl $8,%esp
    movl $1,-4(%ebp)
    movl -4(%ebp),%edx
    incl %edx
    movl %edx,-8(%ebp)
    movl -8(%ebp),%eax
    jmp .L1
.L1:
    leave
    ret

可以看出这里的 edx 寄存器就是作为计算 b 的结果的关键部件，所以 x86 ISA 是基于寄存器的。

如果我们用 java 语言编写这段程序。

public int add() {
    int a = 1;
    int b = a + 1;
    return b;
}

那么编译成给 JVM 看的 ISA 即字节码是这样的。

public int add();
  Code:
     0: iconst_1
     1: istore_1
     2: iload_1
     3: iconst_1
     4: iadd
     5: istore_2
     6: iload_2
     7: ireturn

这里面的 iload_1 iconst_1 和 iadd 都是使用操作数栈，所以字节码是基于栈的 ISA。

这就把第二个问题讲清楚了，不需要其他多余的解释。

------

那具体的一条字节码指令在 CPU 中究竟是如何执行的呢？也是用栈来完成操作的么？

我们看其中一条指令 iconst_1