深入浅出计算机组成原理
徐文浩
bothub创始人
立即订阅
13019 人已学习
课程目录
已完结 62 讲
0/4登录后,你可以任选4讲全文学习。
入门篇 (5讲)
开篇词 | 为什么你需要学习计算机组成原理?
免费
01 | 冯·诺依曼体系结构:计算机组成的金字塔
02 | 给你一张知识地图,计算机组成原理应该这么学
03 | 通过你的CPU主频,我们来谈谈“性能”究竟是什么?
04 | 穿越功耗墙,我们该从哪些方面提升“性能”?
原理篇:指令和运算 (12讲)
05 | 计算机指令:让我们试试用纸带编程
06 | 指令跳转:原来if...else就是goto
07 | 函数调用:为什么会发生stack overflow?
08 | ELF和静态链接:为什么程序无法同时在Linux和Windows下运行?
09 | 程序装载:“640K内存”真的不够用么?
10 | 动态链接:程序内部的“共享单车”
11 | 二进制编码:“手持两把锟斤拷,口中疾呼烫烫烫”?
12 | 理解电路:从电报机到门电路,我们如何做到“千里传信”?
13 | 加法器:如何像搭乐高一样搭电路(上)?
14 | 乘法器:如何像搭乐高一样搭电路(下)?
15 | 浮点数和定点数(上):怎么用有限的Bit表示尽可能多的信息?
16 | 浮点数和定点数(下):深入理解浮点数到底有什么用?
原理篇:处理器 (18讲)
17 | 建立数据通路(上):指令+运算=CPU
18 | 建立数据通路(中):指令+运算=CPU
19 | 建立数据通路(下):指令+运算=CPU
20 | 面向流水线的指令设计(上):一心多用的现代CPU
21 | 面向流水线的指令设计(下):奔腾4是怎么失败的?
22 | 冒险和预测(一):hazard是“危”也是“机”
23 | 冒险和预测(二):流水线里的接力赛
24 | 冒险和预测(三):CPU里的“线程池”
25 | 冒险和预测(四):今天下雨了,明天还会下雨么?
26 | Superscalar和VLIW:如何让CPU的吞吐率超过1?
27 | SIMD:如何加速矩阵乘法?
28 | 异常和中断:程序出错了怎么办?
29 | CISC和RISC:为什么手机芯片都是ARM?
30 | GPU(上):为什么玩游戏需要使用GPU?
31 | GPU(下):为什么深度学习需要使用GPU?
32 | FPGA和ASIC:计算机体系结构的黄金时代
33 | 解读TPU:设计和拆解一块ASIC芯片
34 | 理解虚拟机:你在云上拿到的计算机是什么样的?
原理篇:存储与I/O系统 (17讲)
35 | 存储器层次结构全景:数据存储的大金字塔长什么样?
36 | 局部性原理:数据库性能跟不上,加个缓存就好了?
37 | 高速缓存(上):“4毫秒”究竟值多少钱?
38 | 高速缓存(下):你确定你的数据更新了么?
39 | MESI协议:如何让多核CPU的高速缓存保持一致?
40 | 理解内存(上):虚拟内存和内存保护是什么?
41 | 理解内存(下):解析TLB和内存保护
42 | 总线:计算机内部的高速公路
43 | 输入输出设备:我们并不是只能用灯泡显示“0”和“1”
44 | 理解IO_WAIT:I/O性能到底是怎么回事儿?
45 | 机械硬盘:Google早期用过的“黑科技”
46 | SSD硬盘(上):如何完成性能优化的KPI?
47 | SSD硬盘(下):如何完成性能优化的KPI?
48 | DMA:为什么Kafka这么快?
49 | 数据完整性(上):硬件坏了怎么办?
50 | 数据完整性(下):如何还原犯罪现场?
51 | 分布式计算:如果所有人的大脑都联网会怎样?
应用篇 (5讲)
52 | 设计大型DMP系统(上):MongoDB并不是什么灵丹妙药
53 | 设计大型DMP系统(下):SSD拯救了所有的DBA
54 | 理解Disruptor(上):带你体会CPU高速缓存的风驰电掣
55 | 理解Disruptor(下):不需要换挡和踩刹车的CPU,有多快?
结束语 | 知也无涯,愿你也享受发现的乐趣
免费
答疑与加餐 (5讲)
特别加餐 | 我在2019年F8大会的两日见闻录
FAQ第一期 | 学与不学,知识就在那里,不如就先学好了
用户故事 | 赵文海:怕什么真理无穷,进一寸有一寸的欢喜
FAQ第二期 | 世界上第一个编程语言是怎么来的?
特别加餐 | 我的一天怎么过?
深入浅出计算机组成原理
登录|注册

23 | 冒险和预测(二):流水线里的接力赛

徐文浩 2019-06-17
上一讲,我为你讲解了结构冒险和数据冒险,以及应对这两种冒险的两个解决方案。一种方案是增加资源,通过添加指令缓存和数据缓存,让我们对于指令和数据的访问可以同时进行。这个办法帮助 CPU 解决了取指令和访问数据之间的资源冲突。另一种方案是直接进行等待。通过插入 NOP 这样的无效指令,等待之前的指令完成。这样我们就能解决不同指令之间的数据依赖问题。
着急的人,看完上一讲的这两种方案,可能已经要跳起来问了:“这也能算解决方案么?”的确,这两种方案都有点儿笨。
第一种解决方案,好比是在软件开发的过程中,发现效率不够,于是研发负责人说:“我们需要双倍的人手和研发资源。”而第二种解决方案,好比你在提需求的时候,研发负责人告诉你说:“来不及做,你只能等我们需求排期。” 你应该很清楚地知道,“堆资源”和“等排期”这样的解决方案,并不会真的提高我们的效率,只是避免冲突的无奈之举。
那针对流水线冒险的问题,我们有没有更高级或者更高效的解决方案呢?既不用简单花钱加硬件电路这样“堆资源”,也不是纯粹等待之前的任务完成这样“等排期”。
答案当然是有的。这一讲,我们就来看看计算机组成原理中,一个更加精巧的解决方案,操作数前推

NOP 操作和指令对齐

取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《深入浅出计算机组成原理》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(12)

  • Zain Lau
    今天考研冲北邮!
    2019-06-18
    15
  • haer
    我觉得:cmp没有“访存”,jmp没有“执行”和“访存”
    2019-06-17
    1
    4
  • 活的潇洒
    “流水线停顿的方案,有点儿像游泳比赛的接力方式。下一名运动员,需要在前一个运动员游玩了全程之后,触碰到了游泳池壁才能出发。
    而操作数前推,就好像短跑接力赛。后一个运动员可以提前抢跑,而前一个运动员会多跑一段主动把交接棒传递给他。” 这个比喻很形象、给老师点赞


    day23 笔记:https://www.cnblogs.com/luoahong/p/11440594.html

    作者回复: 😀 谢谢支持

    2019-09-01
    3
  • 曾经瘦过
    感觉老师的讲课顺序特别好 方案都是一点点演变来的 那些看起来高大上的解决方案 都是从最笨的方法开始慢慢优化演变而来的 不是直接一步到位的讲解 能够更好的理解

    作者回复: 谢谢,这个也是我期望这个专栏达到的效果。

    2019-09-27
    2
  • 陈华应
    从指令作用理解,cmp是全的,jmp不需要回写~
    2019-06-17
    2
  • Geek
    后面这些就有点难了,对于非计算机专业的我来说,不过就当看小说了,会一直看下去。。。
    2019-06-17
    2
  • 拯救地球好累
    ---总结---
    为了避免流水线停顿中插入过多的NOP指令,我们引入了操作数前推技术。
    具有依赖关系的两条指令,后一条指令的输入往往来自于前一条指令执行之后写入的寄存器,而操作数前推则通过在硬件上制造一条旁路让前一条指令的执行结果直接作为后一条指令的输入,而无需等待前一条指令写回寄存器。
    这就像工厂流水线中,上一道工序做好的半成品一般会先递送到某个储物柜上以供下个工序的工人使用,增加旁路后好比前一位工人直接将半成品递交给下一位工人,而减少了“放物品-取物品”这样的动作。
    2019-10-27
  • J.D.
    1. 我可以这么理解吗?就是把一个方法:
    int main(int a , int b){
    int c = a + b;
    return c;
    }
    变成
    int main(int a , int b){
    return a + b;
    }
    2. 看了之后有一个想法会不会那个时候的程序员的编程代码里是会考虑到汇编指令这一块,后来随着机器性能的发展,现在的程序员在日常写代码对这块就不太重视了,于是一些《代码简洁之道》一类的书就应运而生了。一方面包括了从视觉上对代码的规范,另一方面也回归到对指令考虑这一块。

    作者回复: J.D.同学

    你好,第一个不能这么理解,只有没有前后依赖的指令才会在流水线里可以同时执行。实际上,你给的代码其实编译器通常会自动优化到后面那个状态。

    早年的程序员的确会考虑得很底层,因为内存空间很小。

    2019-09-28
  • 曾经瘦过
    cmp 指令是比较大小的指令 执行步骤感觉是 取指令 译码 取数据(访问内存 或者寄存器) 比较大小(执行) 出结果(写回) 应该是全的 jump指令是跳转的指令 执行步骤应该是 取指令 译码 跳转(执行) 没有访问内存和写回 的过程
    2019-09-27
  • prader
    1 为了解决,计算机指令中,有太多气泡的,可以采用操作数前推的办法。(上一条指令,的结果不再写入到寄存器中去,而是直接传递给一下需要使用数据的指令。)
    2019-09-22
  • Geek_54edc1
    CMP没有访问内存的操作,JMP没有执行、访问内存的操作
    2019-07-02
  • Linuxer
    请问老师操作数前推中,前一条指令的输出存哪呢?如果还是寄存器那不还是没解决问题,如果不是那指令add不有两种形式,那又如何区分呢?
    2019-06-17
    1
收起评论
12
返回
顶部