通过java代码修改reduce个数,如上图所示,通过 System.out.println(job.getNumReduceTasks()); 显示出来的也是 2 个reduce,但是输出目录下面只有一个输出文件,如下图所示。
通过java代码修改reduce个数,如上图所示,通过 System.out.println(job.getNumReduceTasks()); 显示出来的也是 2 个reduce,但是输出目录下面只有一个输出文件,如下图所示。
数据太少了?
@青牛 感谢青牛老师的回答,我想应该不是数据太少,我加了1000多个整数在input文件里。
工作环境:在CentOS7桌面,使用Intellij IDEA集成开发环境,使用项目管理工具Maven添加依赖。hadoop是 伪分布部署。
我在网上查到有人说是需要在集群部署才可以使用多个reduce,不知对不对?
@BigDataSince2017 本地模式也可以生成多个文件的
@BigDataSince2017 本地模式的reduce也可以设置多个,只不过是多个线程,不像集群是多个进程。所以也可以生成多个文件,建议去看一下我分享的教程