在hadoop环境下运行一个wordcount例子

发布网友 发布时间:2022-04-21 17:59

我来回答

4个回答

懂视网 时间:2022-04-14 10:11

上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境,今天介绍如何运行Hadoop环境下的第一个实例WordCount。 在伪分布模式下运行一下hadoop自带的例子WordCount来感受以下MapReduce过程:这时注意程序是在文件系统dfs运行的,创建的文件

上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境,今天介绍如何运行Hadoop环境下的第一个实例WordCount。

在伪分布模式下运行一下hadoop自带的例子WordCount来感受以下MapReduce过程:这时注意程序是在文件系统dfs运行的,创建的文件也都基于文件系统:

1、准备需要进行wordcount的文件
首先在”/home/hadoop”目录下创建文件夹”file”。接着创建两个文本文件file1.txt和file2.txt,使file1.txt内容为”Hello world”,而file2.txt的内容为”Hello hadoop”。

2、在HDFS上创建输入文件夹input

hadoop fs -mkdir input 

3、将准备的测试文件上传到dfs文件系统中的input目录下,

hadoop fs -put /home/hadoop/file1.txt input
hadoop fs -put /home/hadoop/file2.txt input

4、运行wordcount

说明:hadoop-0.20.2-examples.jar是Hadoop中自带的实例,Hadoop版本不一样,实例名称可能有区别,大家在目录中自行查看。

hadoop jar hadoop-0.20.2-examples.jar wordcount input outputo

5、查看结果

hadoop dfs -cat outputo/part-r-00000 

6、进入bin目录停止stop-all.sh。

上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境,今天介绍如何运行Hadoop […]

热心网友 时间:2022-04-14 07:19

首先进入hadoop安装目录下,新建一个hdfs下的目录,./bin/hadoop fs -mkdir /input,如果你有了,就不必了。接着上传你要进行wordcount的文件到hdfs中,比如这个文件是test.txt,命令是./bin/hadoop fs -put test.txt /input/。然后执行./bin/hadoop jar hadoop-0.20.2-examples.jar wordcount /input /output,然后等执行完,在hdsf下的/output路径下找到结果就好了。
你说的权限问题,你执行 ls -l . 查看是不是你文件的所有者或者群组不一致了,可以用命令chown 或者chgrp来改动。

热心网友 时间:2022-04-14 08:37

hadoop jar xxxx.jar WordCount格式应该是这个样子的追问好像是管理员的权限过低,hadoop目录下的一些文件权限有*,求教如何调整?

热心网友 时间:2022-04-14 10:12

遇到什么问题了吗

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com