如果让你来设计CPU之内存篇（上）

哈喽，我是子牙，一个很卷的硬核男人。深入研究Windows内核、Linux内核、Hotspot源码…聚焦做那些大家想学没地方学的课程：手写操作系统、手写虚拟机、手写模拟器、手写编程语言…

目前已经做了两个成熟的课程：手写JVM、手写OS，感兴趣的小伙伴可以加班主任微信咨询：jvm-anan

今天想从我们自己设计CPU的角度跟大家聊聊不同时代的CPU是如何管理内存的。我会假定你对此完全不了解，循序渐进的展开。如果你觉得你非常熟悉，那你看看我这篇文章的角度如何？

我会先分享硬件层面的，如CPU、内存条。后面在抽时间分享软件层面的，如Java内存模型、MySQL等中间件的内存池与CPU段页、虚拟内存之间的关系……感兴趣的可以关注我公众号

1、早期CPU时代

当我们要去创造一个新生事物的时候，我们甚至都不知道它应该长啥样子，所以我们只能把他想得足够简单、设计得足够简单、制作的足够简单…

人类历史上第一代CPU是4位的，意味着它的地址总线，或者说数据总线，亦或者说寄存器宽度只有4位，是不是没概念？那换个说法，这代CPU的最大寻址能力是16字节，即这代CPU支持的最大内存是16字节。你给他1G的内存条，它也只能用16字节。是不是弱爆了？但是它的出现，具有划时代的意义！

地址总线指CPU能识别的最大内存地址宽度，数据总线指CPU一次性读写内存的最大宽度。还不理解的可以自己找资料再看下。这个属于《计算机组成原理》部分的知识

我们平时说的16位CPU、32位CPU、64位CPU，主要指的是CPU内部寄存器的宽度，这个是确定的。即如果是16位CPU，一次最大支持2字节的数据的运算；32位，最大支持4字节的数据运算；64位，最大支持8字节。

比如你想实现这样的运算：0xffffffff + 1，0xffffffff是4字节的，所以32位CPU、64位CPU可一次性运算得出结果，16位CPU就不可以，因为它的寄存器最大宽度是2字节，所以它至少需要经过两次运算才能得到结果

其实除了指寄存器的宽度，我们也可以理解成内部的地址总线、数据总线的宽度。严谨地说，数据总线的宽度与CPU的位数是一致的，地址总线不一定。有的CPU的地址总线超过CPU的位数，比如Intel8086，一款16位的CPU，它的地址总线是20根，最大支持1M寻址。有的CPU的地址总线少于CPU的位数，比如当下x64架构的CPU，地址总线一般是48根。为什么没用64根呢？你可以猜猜看

科技的发展，其一是需求的拉动，其二是自我的成长…显然，4位CPU最大支持内存16字节，8位CPU最大支持内存256字节，都无法满足未来大运算的需求，于是进入了16位CPU时代…

2、16位CPU时代

理论上来说，16位CPU支持的最大内存是64KB，即2的16次方。但是真正在设计的时候，16位CPU支持的最大内存是1M。是怎么做到的呢？扩展地址总线到20根

这里面就存在一个矛盾：16位CPU的寄存器的宽度是16位，而你支持的最大内存地址是20位，要如何解决呢？

这就说到16位CPU的寻址方式：段基地址+段内偏移。可以这样说，16位CPU奠定了现代CPU的架构基础，因为4位CPU、8位CPU于内存来说，只有页机制。16位CPU引入了段机制，现代的CPU依然是通过段页机制管理内存

举个例子让你更深入理解它的寻址方式，比如读取某个内存位置的值

mov ax, 0x100
mov ds, ax
mov ax, ds:[0x100]

解释下这段代码：

将0x100赋值给寄存器ax，因为后面要给段寄存器ds赋值，要采用间接赋值的方式，段寄存器中存储的值就是段基地址
将ax中的0x100赋值给段寄存器ds
CPU执行这句代码要做的事情较多，看图

CPU会先取出段寄存器ds中的值0x100，左移4位，相当于乘以16，得到0x1000，这个就是段基地址，每个段的大小是2的16次方，即64KB。小括号中的0x100就是这个段内的偏移，所以真正访问的物理地址是0x1100

你可能想到一个问题，会不会出现段重叠？答案是：会！如图

第一个段是从0x100 - 0x10100，第二个段是从0x200 - 0x10200，重叠部分是0x200 - 0x10100。重叠会带来什么不好的影响吗？不会。其实你在写操作系统的时候，如果没有规划好，都会出现内存段重叠问题，这个在32位CPU下可能就有影响了，欲知后事如何，关注公众号，待我写出文章

显然，16位CPU，最大支持1M内存，性能远远不够，于是进入了超级强大的32位CPU时代…