1. Join的基本原理 大家都知道,Hive会将所有的SQL查询转化为Map/Reduce作业运行于Hado…
Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce, Shuff…
Hive 分桶 分桶 对于每一个表或者分区,Hive可以进一步组织成桶,也就是更为细粒度的数据范围划分 Hiv…