问题描述
课hdfs课程结束后,按视频中苏老师的步骤,将hadoop配置完成,启动zookeeper后,启动hadoop,并访问nn1.hadoop:50070成功
为避免重启服务,将虚拟机挂起,再次打开时发现服务个别停止,故全部关掉hadoop各种服务,重新开启,步骤为:
1.启动zookeeper
2.启动start-dfs.sh
3.访问50070端口
此时,出现问题:
检查本机
查看hadoop服务
查看namenode日志
查看ha状态
解决办法:修改core-site.xml中的ipc参数,如果没有就添加如下参数
<!--修改core-site.xml中的ipc参数,防止出现连接journalnode服务ConnectException-->
<property>
<name>ipc.client.connect.max.retries</name>
<value>100</value>
<description>Indicates the number of retries a client will make to establish a server connection.</description>
</property>
<property>
<name>ipc.client.connect.retry.interval</name>
<value>10000</value>
<description>Indicates the number of milliseconds a client will wait for before retrying to establish a server connection.</description>
</property>
原因分析:
namenode节点启动一段时间之后,namenode进程会 停掉,查看日志:Call From nn1.hadoop/192.168.10.200 to nn21:8485 failed on connection exception
使用的start-all 启动的集群,journalnode(端口8485)在nodename后启动, 默认情况下namenode启动10s(maxRetries=10, sleepTime=1000)后journalnode还没有启动,就会报上述错误
注:感谢助教 “奋斗青年” 给我提供的解决办法,成功解决了此问题
本帖已被设为精华帖!