如果让你来设计CPU之内存篇(上)原创
哈喽,我是子牙,一个很卷的硬核男人。深入研究Windows内核、Linux内核、Hotspot源码…聚焦做那些大家想学没地方学的课程:手写操作系统、手写虚拟机、手写模拟器、手写编程语言…
目前已经做了两个成熟的课程:手写JVM、手写OS,感兴趣的小伙伴可以加班主任微信咨询:jvm-anan
今天想从我们自己设计CPU的角度跟大家聊聊不同时代的CPU是如何管理内存的。我会假定你对此完全不了解,循序渐进的展开。如果你觉得你非常熟悉,那你看看我这篇文章的角度如何?
我会先分享硬件层面的,如CPU、内存条。后面在抽时间分享软件层面的,如Java内存模型、MySQL等中间件的内存池与CPU段页、虚拟内存之间的关系……感兴趣的可以关注我公众号
1、早期CPU时代
当我们要去创造一个新生事物的时候,我们甚至都不知道它应该长啥样子,所以我们只能把他想得足够简单、设计得足够简单、制作的足够简单…
人类历史上第一代CPU是4位的,意味着它的地址总线,或者说数据总线,亦或者说寄存器宽度只有4位,是不是没概念?那换个说法,这代CPU的最大寻址能力是16字节,即这代CPU支持的最大内存是16字节。你给他1G的内存条,它也只能用16字节。是不是弱爆了?但是它的出现,具有划时代的意义!
地址总线指CPU能识别的最大内存地址宽度,数据总线指CPU一次性读写内存的最大宽度。还不理解的可以自己找资料再看下。这个属于《计算机组成原理》部分的知识
我们平时说的16位CPU、32位CPU、64位CPU,主要指的是CPU内部寄存器的宽度,这个是确定的。即如果是16位CPU,一次最大支持2字节的数据的运算;32位,最大支持4字节的数据运算;64位,最大支持8字节。
比如你想实现这样的运算:0xffffffff + 1,0xffffffff是4字节的,所以32位CPU、64位CPU可一次性运算得出结果,16位CPU就不可以,因为它的寄存器最大宽度是2字节,所以它至少需要经过两次运算才能得到结果
其实除了指寄存器的宽度,我们也可以理解成内部的地址总线、数据总线的宽度。严谨地说,数据总线的宽度与CPU的位数是一致的,地址总线不一定。有的CPU的地址总线超过CPU的位数,比如Intel8086,一款16位的CPU,它的地址总线是20根,最大支持1M寻址。有的CPU的地址总线少于CPU的位数,比如当下x64架构的CPU,地址总线一般是48根。为什么没用64根呢?你可以猜猜看
科技的发展,其一是需求的拉动,其二是自我的成长…显然,4位CPU最大支持内存16字节,8位CPU最大支持内存256字节,都无法满足未来大运算的需求,于是进入了16位CPU时代…
2、16位CPU时代
理论上来说,16位CPU支持的最大内存是64KB,即2的16次方。但是真正在设计的时候,16位CPU支持的最大内存是1M。是怎么做到的呢?扩展地址总线到20根
这里面就存在一个矛盾:16位CPU的寄存器的宽度是16位,而你支持的最大内存地址是20位,要如何解决呢?
这就说到16位CPU的寻址方式:段基地址+段内偏移。可以这样说,16位CPU奠定了现代CPU的架构基础,因为4位CPU、8位CPU于内存来说,只有页机制。16位CPU引入了段机制,现代的CPU依然是通过段页机制管理内存
举个例子让你更深入理解它的寻址方式,比如读取某个内存位置的值
mov ax, 0x100
mov ds, ax
mov ax, ds:[0x100]
解释下这段代码:
-
将0x100赋值给寄存器ax,因为后面要给段寄存器ds赋值,要采用间接赋值的方式,段寄存器中存储的值就是段基地址
-
将ax中的0x100赋值给段寄存器ds
-
CPU执行这句代码要做的事情较多,看图
CPU会先取出段寄存器ds中的值0x100,左移4位,相当于乘以16,得到0x1000,这个就是段基地址,每个段的大小是2的16次方,即64KB。小括号中的0x100就是这个段内的偏移,所以真正访问的物理地址是0x1100
你可能想到一个问题,会不会出现段重叠?答案是:会!如图
第一个段是从0x100 - 0x10100,第二个段是从0x200 - 0x10200,重叠部分是0x200 - 0x10100。重叠会带来什么不好的影响吗?不会。其实你在写操作系统的时候,如果没有规划好,都会出现内存段重叠问题,这个在32位CPU下可能就有影响了,欲知后事如何,关注公众号,待我写出文章
显然,16位CPU,最大支持1M内存,性能远远不够,于是进入了超级强大的32位CPU时代…
3、32位CPU时代
32位CPU,可以说是比较成熟的CPU了,今年你所能看到的CPU机制,在32位CPU中都有了:段页机制、中断机制、虚拟内存、缓存技术、虚拟化……
关于32位CPU,我们讲两点:
-
因为32位CPU兼容16位CPU,除了兼容,改进了什么?
-
32位CPU引入了保护模式,所以将16位CPU的运行模式称为实模式,包含模式下CPU如何读写内存
在16位CPU中,每次读写内存都要取出段寄存器中的值如0x100,乘以16得到真正的段基地址0x1000,每次运算挺浪费CPU性能的,于是在32位CPU中引入了一个缓存单元:描述符高速缓存器,如图
前面说到,16位CPU,理论上支持的最大内存是64KB,通过扩展地址总线让其支持的最大内存达到1M,真正在寻址的时候将段寄存器中的值左移4位形成真正的段基地址,那32位CPU难道也要才有相同的方式吗?答案是:不可能。
32位CPU引入了全新的段机制,今天的64位CPU依然沿用这套段机制,只是做了些许改变。关于32位CPU的段机制另写文章详细讲解,给大家看个图,先有个了解
题外话
你好,我是子牙。十余年技术生涯,一路披荆斩棘从小白到技术总监到大厂中间件到创业。技术栈如汇编、C语言、C++、Windows内核、Linux内核及特别喜欢研究虚拟机底层实现,对JVM有深入研究。分享的文章偏硬核,很硬的那种。不考虑交个朋友吗?关注硬核子牙: