• godtrue
    2018-09-17
    现在浏览器终于也可以写留言了,非常好!希望能将和老师相互的讨论的功能也开开,否则,不能进行对话,讲某些问题的效果不太好!

    循环优化,站在编译器的角度来作出的优化动作,老师介绍了几种方式,经过听讲,我感觉万变不离其宗,优化的核心关键点还是少做一些事情,当然,事情少做了,作用不能减!

    1:循环无关码外提——将循环内的某些无关代码外移,减少某些程序的反复执行
    2:循环展开——减少循环条件的判断,针对循环次数少的循环
    3:循环判断外提——减少每次循环的都进行判断次数
    4:循环剥离——将不通用的处理起来稍微费劲一些的动作,放在循环外处理

    总之,要做减法!
    性能优化的核心点:
    1:让做的快的做
    2:如果不能实现,则让做的快的做多一点,做的慢的少做一些
    3:取巧,事情少做了,但是目的依旧能够达到
    展开

    作者回复: 对的。在程序语义不改变的情况下,编译器会尽可能地减少生成代码的工作量。

    
     11
  • Geek_488a8e
    2018-09-19
    这些都是DSP代码典型的优化方法,目的是防止打断CPU的指令流水,提高指令处理的并行度

    作者回复: Good to know

    
     6
  • Len
    2018-09-18
    老师,如果有这样一段代码:

    for( ... ) {
       sum += x + y + a[i];
    }

    借助 Sea-of-Nodes IR 能把「x + y」表达式外提出去。

    但,如果表达式变成如下:

    sum += x + a[i] + y;

    也能借助 IR 外提 「x + y」吗?
    展开

    作者回复: 赞想法!会的。

    
     6
  • 无言的约定
    2019-10-12
    for (int i = INIT; i < LIMIT; i += STRIDE) {
      if (i < 0 || i >= a.length) { // range check
        throw new ArrayIndexOutOfBoundsException();
      }
      sum += a[i];
    }
    ----------
    // 经过下标范围检测外提之后:
    if (INIT < 0 || IMAX >= a.length) {
      // IMAX 是 i 所能达到的最大值,注意它不一定是 LIMIT-1
      detopimize(); // never returns
    }
    for (int i = INIT; i < LIMIT; i += STRIDE) {
      sum += a[i]; // 不包含下标范围检测
    }
    老师,这个IMAX该如何初始化?
    展开
    
     1
  • 一个坏人
    2018-09-17
    是不是写应用系统的时候没必要按照优化方式写,编译器反正会优化?!

    作者回复: 很多情况下是的。但也要考虑编译器没有预算来做优化的情况(比如循环太大)。

    一般来说,应用代码更应注重可读性。

    
     1
  • Scott
    2018-09-17
    这样展开后有一个强度削弱的机会,四个byte的赋值合并成一个int?

    作者回复: 对的!不叫强度削弱,叫向量化,下一篇讲

    
     1
  • 饭粒
    2019-12-25
    有点像小学四则运算里运用提公因式法等技巧来使计算简单。

    作者回复: 哈哈,确实像

    
    
  • Yoph
    2019-07-16
    这些优化全都是即时编译器做的,解释器的执行过程中有相关的优化吗?
    
    
  • 天之蓝
    2018-11-28
    请教两个问题,循环展开那个例子如果64是65是不是就越界了?实践的代码如果length为6按条件只会循环一次那下标为4、5的不就执行不到了吗?
    
    
  • Leon Wong
    2018-10-07
    请问老师,实践环节的循环展开后的数组越界,编译器是怎么处理的?是不是当length小于4,循环完全展开就可以了,实际上这个展开有一个隐含的假定,即length大于4的情况。

    作者回复: 对的,如果是常量长度,而且小于4,那么完全展开就行了。

    
    
  • 白三岁
    2018-09-28
    实践环节的代码,由于i++相应的变成了i+4。前面的判断条件dst.length就不应该减4了吧。

    作者回复: 观察到位!这个主要是为了避免访问越界。你可以假定length为3,再看看这段代码。

    
    
  • 杨春鹏
    2018-09-19
    循环展开优化,如何防止出现数组下边越界?
    Length=3n+2,每次循环展开n,n+1,n+2,当第n次循环结束的时候,下标开始从3n+1、3n+2、3n+3,那么访问3n+2与3n+3对应值时,就会出现数组越界。
    
    
我们在线,来聊聊吧