分类导航

CentOS 发布时间：2022-05-09 发布网站：大佬教程 code.js-code.com

大佬教程收集整理的这篇文章主要介绍了CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序，大佬教程大佬觉得挺不错的，现在分享给大家，也给大家做个参考。

CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序@H_450_3@

1 准备工作@H_450_3@

1.1 创建输入输出路径@H_450_3@

首先在hdfs中创建数据目录，用来指定运行wordcount程序的输入输出路径。Hadoop命令在hadoop文件夹下的bin目录下，可通过如下命令查看：@H_450_3@

命令：ll /usr/local/hadoop/bin@H_450_3@

查看结果如图1所示：@H_450_3@

图1 查找hadoop命令@H_450_3@

（1）创建文件上传目录@H_450_3@

1）首先进入到hadoop文件夹下（命令：cd /usr/local/hadoop）；@H_450_3@

2）创建目录“/data/wordcount”，用来存放hadoop自带的wordcount例子的数据文件。@H_450_3@

命令：bin/hadoop fs -mkdir-p /data/wordcount （创建上传文件目录）@H_450_3@

命令：bin/hadoop fs -ls/ （查看创建的文件目录）@H_450_3@

命令操作结果如图2所示：@H_450_3@

图2 创建文件上传目录@H_450_3@

（2）创建结果输出目录@H_450_3@

1）创建目录“/output”，用来存放运行Mapreduce任务后输出的结果文件。@H_450_3@

命令：bin/hadoop fs -mkdir-p /output/ （创建输出结果文件存放目录）@H_450_3@

命令：bin/hadoop fs -ls/ （查看创建的文件目录）@H_450_3@

命令操作结果如图3所示：@H_450_3@

图3 创建结果输出目录@H_450_3@

1.2 创建本地输入文件@H_450_3@

命令： sudo vi /usr/inputword@H_450_3@

输入文件内容，如图4所示：@H_450_3@

图4 创建本地输入文件@H_450_3@

文件创建完成之后可通过命令“cat /usr/inputword”查看文件内容，如图5所示：@H_450_3@

图5 查看本地文件内容@H_450_3@

2 上传文件@H_450_3@

（1）将上述创建的本地文件上传到HDFS中。@H_450_3@

命令：bin/hadoop fs –put/usr/inputword /data/wordcount/@H_450_3@

注意：当需要多次执行wordcount程序时，如果不需要保留前一次上传到/data/wordcount/目录下的本地文件inputword，可将其删除，然后直接修改本地文件inputword里面的内容，再重新上传到/data/wordcount/目录下。删除上传到/data/wordcount/目录下的本地文件inputword文件的命令为：@H_450_3@

bin/hadoop fs –rm/data/wordcount/inputword@H_450_3@

如果需要保留每次执行时上传到/data/wordcount/目录下的本地文件，可以重新创建新的本地文件，只要保证每次创建的本地文件名称不相同即可，然后将不同名的本地文件重新上传到HDFS中。@H_450_3@

（2）完成上传后可查看文件情况@H_450_3@

命令：bin/hadoop fs -ls /data/wordcount@H_450_3@

（3）还可查看上传到HDFS中的文件的内容@H_450_3@

命令：bin/hadoop fs -text/data/wordcount/inputword@H_450_3@

执行结果如图6所示：@H_450_3@

图6 上传文件执行结果@H_450_3@

3 运行wordcount例子@H_450_3@

3.1 找到examples例子@H_450_3@

运行Hadoop自带的wordcount首先需要找到examples例子（hadoop-mapreduce-examples-2.7.2.jar），该例子位于Hadoop文件夹下的“/share/hadoop/mapreduce”目录下。可通过如下命令查看：@H_450_3@

（1）直接在根目录下查看：@H_450_3@

命令：ls/usr/local/hadoop/share/hadoop/mapreduce@H_450_3@

查看结果如图7所示：@H_450_3@

图7 在根目录下查找examples@H_450_3@

（2）进入Hadoop文件目录下查看（我的Hadoop文件夹在“/usr/local”目录下）：@H_450_3@

命令：1）cd /usr/local/hadoop@H_450_3@

2）lsshare/hadoop/mapreduce@H_450_3@

查询结果如图8所示：@H_450_3@

图8 在Hadoop文件目录下查找examples@H_450_3@

3.2 运行hadoop自带的wordcount程序@H_450_3@

命令：@H_450_3@

bin/hadoopjar/usr/local/hadoop/share/hadoop/mapreduce/@H_450_3@

hadoop-mapreduce-examples-2.7.2.jar wordcount /data/wordcount /output/wordcount@H_450_3@

注意：此处的输出目录output下的输出结果文件名wordcount不是固定的，在执行不同的输入文件时可相应地更改为不同的文件名称。避免因同名而发生冲突，导致最新上传的本地文件得不到执行，而只保留之前的执行结果。@H_450_3@

程序运行信息如图9所示：@H_450_3@

@H_450_3@

图9_1 程序运行信息@H_450_3@

@H_450_3@

图9_2 程序运行信息@H_450_3@

@H_450_3@

图9_3 程序运行信息@H_450_3@

@H_450_3@

图9_4 程序运行信息@H_450_3@

3.3 查看执行结果@H_450_3@

命令：bin/hadoop fs -text/output/wordcount/part-r-00000@H_450_3@

显示结果如图10所示：@H_450_3@

@H_450_3@

图10 程序执行结果@H_450_3@

注意：此处的wordcount是指执行wordcount程序时指定的输出目录下的输出结果文件，可通过修改此文件名来显示执行不同文件各自所得的输出结果。@H_450_3@

补充说明：完成所有的操作后如果不想保留输入输出目录，可将其一一删除，命令如下：@H_450_3@

删除输入文件目录：bin/hadoop fs -rmr/data@H_450_3@

删除输出文件目录：bin/hadoop fs -rmr/output@H_450_3@

执行上述两条命令后可通过如下命令查看到显示结果中只剩下tmp文件目录：@H_450_3@

bin/hadoop fs-ls /@H_450_3@

大佬总结

以上是大佬教程为你收集整理的CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序全部内容，希望文章能够帮你解决CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：

上一篇: centos安装mail命令以及mutt命令... 下一篇:CentOS 6.2最小化安装后再安装图...

猜你在找的CentOS相关文章

Linux（CentOS 5.5）安装Apache 2.2.3 2022-05-09
ContOS7切换国内源 2019-10-31
在阿里云Centos下LNMP环境搭建 2019-10-31
CentOS7.x的DNS服务的基础配置 2019-10-31
安装VMwareTools时出错：What is the location of the directory of C header files t... 2019-10-31
CentOS的启动方式和语言设置 2019-10-31
centos，fedora 如何开机自动联网？？？ 2019-10-31
CentOS 5.5使用yum安装LAMP环境（sohu源） 2019-10-31
CentOS 6.0安装图解教程 2019-10-31
Apache与PHP的整合(编译安装)，不涉及MySQL数据库的整合 2019-10-31