性能文章>如果让你来设计CPU之内存篇(上)>

如果让你来设计CPU之内存篇(上)原创

339398

哈喽,我是子牙,一个很卷的硬核男人。深入研究Windows内核、Linux内核、Hotspot源码…聚焦做那些大家想学没地方学的课程:手写操作系统、手写虚拟机、手写模拟器、手写编程语言…

目前已经做了两个成熟的课程:手写JVM、手写OS,感兴趣的小伙伴可以加班主任微信咨询:jvm-anan

今天想从我们自己设计CPU的角度跟大家聊聊不同时代的CPU是如何管理内存的。我会假定你对此完全不了解,循序渐进的展开。如果你觉得你非常熟悉,那你看看我这篇文章的角度如何?

我会先分享硬件层面的,如CPU、内存条。后面在抽时间分享软件层面的,如Java内存模型、MySQL等中间件的内存池与CPU段页、虚拟内存之间的关系……感兴趣的可以关注我公众号

1、早期CPU时代

当我们要去创造一个新生事物的时候,我们甚至都不知道它应该长啥样子,所以我们只能把他想得足够简单、设计得足够简单、制作的足够简单…

人类历史上第一代CPU是4位的,意味着它的地址总线,或者说数据总线,亦或者说寄存器宽度只有4位,是不是没概念?那换个说法,这代CPU的最大寻址能力是16字节,即这代CPU支持的最大内存是16字节。你给他1G的内存条,它也只能用16字节。是不是弱爆了?但是它的出现,具有划时代的意义!

地址总线指CPU能识别的最大内存地址宽度,数据总线指CPU一次性读写内存的最大宽度。还不理解的可以自己找资料再看下。这个属于《计算机组成原理》部分的知识

我们平时说的16位CPU、32位CPU、64位CPU,主要指的是CPU内部寄存器的宽度,这个是确定的。即如果是16位CPU,一次最大支持2字节的数据的运算;32位,最大支持4字节的数据运算;64位,最大支持8字节。

比如你想实现这样的运算:0xffffffff + 1,0xffffffff是4字节的,所以32位CPU、64位CPU可一次性运算得出结果,16位CPU就不可以,因为它的寄存器最大宽度是2字节,所以它至少需要经过两次运算才能得到结果

其实除了指寄存器的宽度,我们也可以理解成内部的地址总线、数据总线的宽度。严谨地说,数据总线的宽度与CPU的位数是一致的,地址总线不一定。有的CPU的地址总线超过CPU的位数,比如Intel8086,一款16位的CPU,它的地址总线是20根,最大支持1M寻址。有的CPU的地址总线少于CPU的位数,比如当下x64架构的CPU,地址总线一般是48根。为什么没用64根呢?你可以猜猜看

科技的发展,其一是需求的拉动,其二是自我的成长…显然,4位CPU最大支持内存16字节,8位CPU最大支持内存256字节,都无法满足未来大运算的需求,于是进入了16位CPU时代…

2、16位CPU时代

理论上来说,16位CPU支持的最大内存是64KB,即2的16次方。但是真正在设计的时候,16位CPU支持的最大内存是1M。是怎么做到的呢?扩展地址总线到20根

这里面就存在一个矛盾:16位CPU的寄存器的宽度是16位,而你支持的最大内存地址是20位,要如何解决呢?

这就说到16位CPU的寻址方式:段基地址+段内偏移。可以这样说,16位CPU奠定了现代CPU的架构基础,因为4位CPU、8位CPU于内存来说,只有页机制。16位CPU引入了段机制,现代的CPU依然是通过段页机制管理内存

举个例子让你更深入理解它的寻址方式,比如读取某个内存位置的值

mov ax, 0x100
mov ds, ax
mov ax, ds:[0x100]

解释下这段代码:

  1. 将0x100赋值给寄存器ax,因为后面要给段寄存器ds赋值,要采用间接赋值的方式,段寄存器中存储的值就是段基地址

  2. 将ax中的0x100赋值给段寄存器ds

  3. CPU执行这句代码要做的事情较多,看图

CPU会先取出段寄存器ds中的值0x100,左移4位,相当于乘以16,得到0x1000,这个就是段基地址,每个段的大小是2的16次方,即64KB。小括号中的0x100就是这个段内的偏移,所以真正访问的物理地址是0x1100

你可能想到一个问题,会不会出现段重叠?答案是:会!如图

第一个段是从0x100 - 0x10100,第二个段是从0x200 - 0x10200,重叠部分是0x200 - 0x10100。重叠会带来什么不好的影响吗?不会。其实你在写操作系统的时候,如果没有规划好,都会出现内存段重叠问题,这个在32位CPU下可能就有影响了,欲知后事如何,关注公众号,待我写出文章

显然,16位CPU,最大支持1M内存,性能远远不够,于是进入了超级强大的32位CPU时代…

3、32位CPU时代

32位CPU,可以说是比较成熟的CPU了,今年你所能看到的CPU机制,在32位CPU中都有了:段页机制、中断机制、虚拟内存、缓存技术、虚拟化……

关于32位CPU,我们讲两点:

  1. 因为32位CPU兼容16位CPU,除了兼容,改进了什么?

  2. 32位CPU引入了保护模式,所以将16位CPU的运行模式称为实模式,包含模式下CPU如何读写内存

     

在16位CPU中,每次读写内存都要取出段寄存器中的值如0x100,乘以16得到真正的段基地址0x1000,每次运算挺浪费CPU性能的,于是在32位CPU中引入了一个缓存单元:描述符高速缓存器,如图

前面说到,16位CPU,理论上支持的最大内存是64KB,通过扩展地址总线让其支持的最大内存达到1M,真正在寻址的时候将段寄存器中的值左移4位形成真正的段基地址,那32位CPU难道也要才有相同的方式吗?答案是:不可能。

32位CPU引入了全新的段机制,今天的64位CPU依然沿用这套段机制,只是做了些许改变。关于32位CPU的段机制另写文章详细讲解,给大家看个图,先有个了解

题外话

你好,我是子牙。十余年技术生涯,一路披荆斩棘从小白到技术总监到大厂中间件到创业。技术栈如汇编、C语言、C++、Windows内核、Linux内核及特别喜欢研究虚拟机底层实现,对JVM有深入研究。分享的文章偏硬核,很硬的那种。不考虑交个朋友吗?关注硬核子牙:

 

点赞收藏
分类:标签:
子牙_公号硬核子牙

对编程语言的设计与实现有浓厚兴趣。聚焦Hotspot源码、Linux内核研究,硬核干货分享

请先登录,查看9条精彩评论吧
快去登录吧,你将获得
  • 浏览更多精彩评论
  • 和开发者讨论交流,共同进步

为你推荐

服务器之 ECC 内存的工作原理

服务器之 ECC 内存的工作原理

8
9