Hadoop笔记 Help

004-CLI文件操作及yarn测试

一、CLI操作HDFS

# 创建目录 hdfs dfs -mkdir -p /opt/data # 上传文件 hdfs dfs -put /opt/data/wc.input /opt/data/

二、测试yarn任务管理

cd /opt/modules/hadoop-3.1.3 hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /opt/data/wc.input /opt/data/wc.output

1.错误一

成功报错以下内容

解决方法:

在etc/hadoop/mapred-site.xml中添加以下配置

<property> <name>yarn.app.mapreduce.am.env</name> <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value> </property> <property> <name>mapreduce.map.env</name> <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value> </property> <property> <name>mapreduce.reduce.env</name> <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value> </property>

2. 错误二

报错信息

查看日志

jps # 发现resourcemanager直接挂掉了,于是检查resourcemanager的日志 tail -n100 /opt/modules/hadoop-3.1.3/logs/hadoop-hadoop-resourcemanager-hadoop03.log # 日志报错信息如下 2024-09-19 17:52:21,634 ERROR org.apache.hadoop.yarn.server.resourcemanager.rmapp.RMAppImpl: App: application_1726739460497_0001 can't handle this event at current state

问题原因

解决方法

3. 错误三

成功报错以下内容

Container exited with a non-zero exit code 1. Error file: prelaunch.err.

解决方式

hadoop classpath # 拷贝输出内容添加到yarn-site.xml /opt/modules/hadoop-3.1.3/etc/hadoop:/opt/modules/hadoop-3.1.3/share/hadoop/common/lib/*:/opt/modules/hadoop-3.1.3/share/hadoop/common/*:/opt/modules/hadoop-3.1.3/share/hadoop/hdfs:/opt/modules/hadoop-3.1.3/share/hadoop/hdfs/lib/*:/opt/modules/hadoop-3.1.3/share/hadoop/hdfs/*:/opt/modules/hadoop-3.1.3/share/hadoop/mapreduce/lib/*:/opt/modules/hadoop-3.1.3/share/hadoop/mapreduce/*:/opt/modules/hadoop-3.1.3/share/hadoop/yarn:/opt/modules/hadoop-3.1.3/share/hadoop/yarn/lib/*:/opt/modules/hadoop-3.1.3/share/hadoop/yarn/*
<property> <name>yarn.application.classpath</name> <value></value> </property>

4. 错误四

运行发现卡住不动

# 卡在这里不动了一直是0% INFO mapreduce.Job: map 0% reduce 0% free -m # 发现内存用完了

解决方法

更改规格,改为4G内存

5. 错误五

运行报错

2024-09-19 20:11:05,727 INFO mapreduce.JobSubmitter: Cleaning up the staging area file:/tmp/hadoop/mapred/staging/hadoop824734288/.staging/job_local824734288_0001 ENOENT: No such file or directory

原因

解决方法

三、未报错测试成功

在yarn-web和hdfs-web页面可查看运行的任务和计算结果。

在hdfs-web页面中查看/opt/data下是否有wc.output文件夹,并进入查看是否有_SUCCESS标识文件。有则表示成功。

在yarn-web页面中点击Applications,下方查看执行的任务,查看FinalState一栏中是否为SUCCEEDED,是则表示成功,FAILED表示失败。

# 查看计算结果 hdfs dfs -cat /opt/data/wc.output/part-r-00000 # 输出计算结果 a 2 b 1 c 1 d 2 # 下载结果文件 hdfs dfs -get /opt/data/wc.output ~ # 查看下载文件 ls ~

上述均成功后完成伪分布式所有内容(hadoop、hdfs、yarn)的配置。

Last modified: 10 October 2024