• 黄海峰
    2020-02-03
    shuffle把相同key发送给同一个reduce,那岂不是还是要传输大量数据?还是实际是把相同key放到相同hdfs文件reduce进程读取?

    作者回复: 确实要传输很大量数据。

    shuffle不通过HDFS,即使通过HDFS,也解决不了数据传输的问题。

    
    
我们在线,来聊聊吧