深入浅出计算机组成原理
徐文浩
bothub创始人
立即订阅
13019 人已学习
课程目录
已完结 62 讲
0/4登录后,你可以任选4讲全文学习。
入门篇 (5讲)
开篇词 | 为什么你需要学习计算机组成原理?
免费
01 | 冯·诺依曼体系结构:计算机组成的金字塔
02 | 给你一张知识地图,计算机组成原理应该这么学
03 | 通过你的CPU主频,我们来谈谈“性能”究竟是什么?
04 | 穿越功耗墙,我们该从哪些方面提升“性能”?
原理篇:指令和运算 (12讲)
05 | 计算机指令:让我们试试用纸带编程
06 | 指令跳转:原来if...else就是goto
07 | 函数调用:为什么会发生stack overflow?
08 | ELF和静态链接:为什么程序无法同时在Linux和Windows下运行?
09 | 程序装载:“640K内存”真的不够用么?
10 | 动态链接:程序内部的“共享单车”
11 | 二进制编码:“手持两把锟斤拷,口中疾呼烫烫烫”?
12 | 理解电路:从电报机到门电路,我们如何做到“千里传信”?
13 | 加法器:如何像搭乐高一样搭电路(上)?
14 | 乘法器:如何像搭乐高一样搭电路(下)?
15 | 浮点数和定点数(上):怎么用有限的Bit表示尽可能多的信息?
16 | 浮点数和定点数(下):深入理解浮点数到底有什么用?
原理篇:处理器 (18讲)
17 | 建立数据通路(上):指令+运算=CPU
18 | 建立数据通路(中):指令+运算=CPU
19 | 建立数据通路(下):指令+运算=CPU
20 | 面向流水线的指令设计(上):一心多用的现代CPU
21 | 面向流水线的指令设计(下):奔腾4是怎么失败的?
22 | 冒险和预测(一):hazard是“危”也是“机”
23 | 冒险和预测(二):流水线里的接力赛
24 | 冒险和预测(三):CPU里的“线程池”
25 | 冒险和预测(四):今天下雨了,明天还会下雨么?
26 | Superscalar和VLIW:如何让CPU的吞吐率超过1?
27 | SIMD:如何加速矩阵乘法?
28 | 异常和中断:程序出错了怎么办?
29 | CISC和RISC:为什么手机芯片都是ARM?
30 | GPU(上):为什么玩游戏需要使用GPU?
31 | GPU(下):为什么深度学习需要使用GPU?
32 | FPGA和ASIC:计算机体系结构的黄金时代
33 | 解读TPU:设计和拆解一块ASIC芯片
34 | 理解虚拟机:你在云上拿到的计算机是什么样的?
原理篇:存储与I/O系统 (17讲)
35 | 存储器层次结构全景:数据存储的大金字塔长什么样?
36 | 局部性原理:数据库性能跟不上,加个缓存就好了?
37 | 高速缓存(上):“4毫秒”究竟值多少钱?
38 | 高速缓存(下):你确定你的数据更新了么?
39 | MESI协议:如何让多核CPU的高速缓存保持一致?
40 | 理解内存(上):虚拟内存和内存保护是什么?
41 | 理解内存(下):解析TLB和内存保护
42 | 总线:计算机内部的高速公路
43 | 输入输出设备:我们并不是只能用灯泡显示“0”和“1”
44 | 理解IO_WAIT:I/O性能到底是怎么回事儿?
45 | 机械硬盘:Google早期用过的“黑科技”
46 | SSD硬盘(上):如何完成性能优化的KPI?
47 | SSD硬盘(下):如何完成性能优化的KPI?
48 | DMA:为什么Kafka这么快?
49 | 数据完整性(上):硬件坏了怎么办?
50 | 数据完整性(下):如何还原犯罪现场?
51 | 分布式计算:如果所有人的大脑都联网会怎样?
应用篇 (5讲)
52 | 设计大型DMP系统(上):MongoDB并不是什么灵丹妙药
53 | 设计大型DMP系统(下):SSD拯救了所有的DBA
54 | 理解Disruptor(上):带你体会CPU高速缓存的风驰电掣
55 | 理解Disruptor(下):不需要换挡和踩刹车的CPU,有多快?
结束语 | 知也无涯,愿你也享受发现的乐趣
免费
答疑与加餐 (5讲)
特别加餐 | 我在2019年F8大会的两日见闻录
FAQ第一期 | 学与不学,知识就在那里,不如就先学好了
用户故事 | 赵文海:怕什么真理无穷,进一寸有一寸的欢喜
FAQ第二期 | 世界上第一个编程语言是怎么来的?
特别加餐 | 我的一天怎么过?
深入浅出计算机组成原理
登录|注册

24 | 冒险和预测(三):CPU里的“线程池”

徐文浩 2019-06-19
过去两讲,我为你讲解了通过增加资源、停顿等待以及主动转发数据的方式,来解决结构冒险和数据冒险问题。对于结构冒险,由于限制来自于同一时钟周期不同的指令,要访问相同的硬件资源,解决方案是增加资源。对于数据冒险,由于限制来自于数据之间的各种依赖,我们可以提前把数据转发到下一个指令。
但是即便综合运用这三种技术,我们仍然会遇到不得不停下整个流水线,等待前面的指令完成的情况,也就是采用流水线停顿的解决方案。比如说,上一讲里最后给你的例子,即使我们进行了操作数前推,因为第二条加法指令依赖于第一条指令从内存中获取的数据,我们还是要插入一次 NOP 的操作。
那这个时候你就会想了,那我们能不能让后面没有数据依赖的指令,在前面指令停顿的时候先执行呢?
答案当然是可以的。毕竟,流水线停顿的时候,对应的电路闲着也是闲着。那我们完全可以先完成后面指令的执行阶段。

填上空闲的 NOP:上菜的顺序不必是点菜的顺序

之前我为你讲解的,无论是流水线停顿,还是操作数前推,归根到底,只要前面指令的特定阶段还没有执行完成,后面的指令就会被“阻塞”住。
但是这个“阻塞”很多时候是没有必要的。因为尽管你的代码生成的指令是顺序的,但是如果后面的指令不需要依赖前面指令的执行结果,完全可以不必等待前面的指令运算完成。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《深入浅出计算机组成原理》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(22)

  • 焰火
    数据从cpu --> 寄存器 --> 内存, 数据从CPU到内存中间有个寄存器,寄存器和内存数据交换应该也是整页交换,如果不顺序写回寄存器的话,很有可能在寄存器页边界的时候,到内存发生时间差,导致后面寄存器再重新取内存的时候发生数据错误,之前数据不依赖,不保证后面数据不依赖。所以还是顺序写回比较安全。
    2019-07-19
    9
  • xindoo
    我觉得强内存模型是为了保证不同指令对同一内存地址的读写正确性,不同指令的执行不仅仅有寄存器数据依赖,还会有内存数据依赖。
    2019-06-19
    2
    2
  • Leon📷
    搜了下资料,假如有两个阶段,之间没有数据依赖,第一个阶段判断变量a是否为true,再执行,否则退出。第二个阶段直接把a置为false,如果乱序执行,第二个阶段先执行影响业务逻辑,第一个阶段本来可以执行的,现在直接退出了
    2019-06-19
    1
  • loser
    应该是数据一致性问题,多核访问相同的内存。但是有自己的缓存,寄存器。
    2019-12-09
  • 拯救地球好累
    ---问题---
    老师您好,对于指令提交部分不是很理解,如果指令提交部分依然是需要保证原有指令顺序的话,那不是在这个部分先完成的指令依然要等待原有顺序在它之前的指令的完成,比如“x = y * z”要等待“d = a * e”的执行完成才能提交?
    2019-10-27
  • Better me
    对于老师在文中举例的三行代码,由于都是加法指令那么是否有可能前两行代码先被转发进行优化,而不出现文中老师说的这种情况呢?如果是这样那相当于第2、3条指令都会插入一个NOP,应该和文中说到的情况能达到一样的优化效果。还有文中老师说到的这种乱序执行优化,第2条指令在等待第1条指令访存,而此时由于乱序执行优化仍然要保持最后的提交顺序,指令1的结果并不会写会到寄存器中,而是输出到重排序缓冲区,那么此时指令2是到缓冲区拿到的依赖数据吗?老师有空解答一下
    2019-10-08
  • 曾经瘦过
    保障内存访问的顺序 就类似于在编程中多线程对同一个变量的操作一样,会导致数据不可预测,导致出错
    2019-10-08
  • prader
    1 增加高速缓存和指令跳转解决的是,一条指令,的效率问题。这样,一条大指令执行顺序还是顺序执行。
     2 乱序执行,是指在指令执行之前,和指令执行之后分别增加保栈和指令缓冲区,确保指令能够异步执行。
    2019-09-22
  • 活的潇洒
    “这就好比你开了一家餐馆,顾客会排队来点菜。餐馆的厨房里会有洗菜、切菜、炒菜、上菜这样的各个步骤。后厨也是按照点菜的顺序开始做菜的。但是不同的菜需要花费的时间和工序可能都有差别。有些菜做起来特别麻烦,特别慢。比如做一道佛跳墙有好几道工序。我们没有必要非要等先点的佛跳墙上菜了,再开始做后面的炒鸡蛋。只要有厨子空出来了,就可以先动手做前面的简单菜,先给客户端上去。” 这个比喻很赞

    day24 笔记:https://www.cnblogs.com/luoahong/p/11436627.html
    2019-09-01
  • Mango
    思考题,感觉是内存屏障,防止多核CPU操作共享内存时出现数据冒险问题。

    作者回复: Mango同学你好,

    可以更具体一点么,离答案很接近了,但是我认为这个不能叫做“数据冒险”问题。

    2019-08-28
  • 小先生
    课后思考题回答:
    如果数据写回不是按照顺序的话,如果对同一个数据的修改顺序反了,可能导致最终的结果就是错误的
    2019-08-27
    1
  • -W.LI-
    老师好!非常通俗易懂,不过story buffer(存储缓冲区)我是第一次见。老师能稍微介绍下么?寄存器->多级高速缓存->主存之前的理解是这样的。。
    2019-06-24
  • -W.LI-
    感觉判断,数据是否准备就绪有点难度,老师后面会讲么?乱序执行的时候怎么保证依赖顺序正确。数据依赖,反依赖,输出依赖那个。
    2019-06-24
  • 古夜
    老师好,有没有什么思路从硬件角度理解多线程呢?有什么资料可以作为参考呢?
    2019-06-20
  • coder
    强内存模型可以保证数据的一致性🌝🌝
    2019-06-20
  • cc
    老师,有一点没想明白。五级流水线,取指令-译指令-执行-访存-写回。这里的访存是干什么的?能否具体举例讲一讲?我理解访存是把数据读入寄存器。那这样的话,访存应该先于执行才对。感谢答疑
    2019-06-20
  • 鱼向北游
    思考题应该是程序真实逻辑有时候会依赖内存访问顺序,而不是单单依赖数据的计算结果正确性吧
    2019-06-19
  • lzhao
    计算后的值写到Store Buffer中,什么时候写道主内存和寄存器呢?带来的可见性问题,通知屏障指令又是怎么解决的,能单独开一章节讲这个问题吗?或者我加你的联系方式,单独针对几个问题问一下?谢谢
    2019-06-19
  • lzhao
    能不能配合指令重排序带来的并发性问题,cpu时怎么解决的,Java语言里面为什么又要定义自己的一套内存模型,是CPU 的内存模型解决不掉这种并发问题吗?多个CPU指令重排序会带来什么样的并发问题?
    2019-06-19
  • Linuxer
    然后在重排序缓冲区里,把对应的计算结果的提交顺序,仍然设置成 a -> d -> x,而计算完成的顺序是 x -> a -> d。为什么x先完成
    2019-06-19
收起评论
22
返回
顶部