如何减少Hadoop Map端到Reduce端的数据传输量
1、实现Reducer函数的方法代码

2、实现Partitioner分区和ReduceTasks数量的方法代码

3、实现分区Partitioner的方法代码

4、创建的自定义key:NewPairKey需要的接口方法代码

5、实现设置了job的setSortComparatorClass(KeyComparator.class)的方法代码

6、使用自定义类NewPairKey中实现的compareTo()方法作为key比较方法代码

7、IntWritable源码如下



8、实现分组函数类的方法代码
