tajo 클러스터 세팅하는데 워커 노드에서 오류가 보인다.
2015-08-04 09:34:19,329 INFO org.apache.tajo.util.history.HistoryWriter: HistoryWriter_test-003.com_28093 started.
2015-08-04 09:34:19,384 WARN org.apache.tajo.rpc.NettyClientBase: 연결이 거부됨: test-001.com/10.10.10.1:26003 Try to reconnect
2015-08-04 09:34:20,386 WARN org.apache.tajo.rpc.NettyClientBase: 연결이 거부됨: test-001.com/10.10.10.1:26003 Try to reconnect
2015-08-04 09:34:21,389 WARN org.apache.tajo.rpc.NettyClientBase: 연결이 거부됨: test-001..com/10.10.10.1:26003 Try to reconnect
2015-08-04 09:34:22,393 ERROR org.apache.tajo.worker.WorkerHeartbeatService: Max retry count has been exceeded. attempts=3 caused by: java.net.ConnectException: 연결이 거부됨: test-001.com/10.10.10.1:26003
io.netty.channel.ConnectTimeoutException: Max retry count has been exceeded. attempts=3 caused by: java.net.ConnectException: 연결이 거부됨: test-001.com/10.10.10.1:26003
at org.apache.tajo.rpc.NettyClientBase.doReconnect(NettyClientBase.java:139)
at org.apache.tajo.rpc.NettyClientBase.connect(NettyClientBase.java:118)
at org.apache.tajo.rpc.RpcClientManager.getClient(RpcClientManager.java:96)
at org.apache.tajo.worker.WorkerHeartbeatService$WorkerHeartbeatThread.run(WorkerHeartbeatService.java:187)
2015-08-04 09:34:32,142 ERROR org.apache.tajo.worker.TajoWorker: RECEIVED SIGNAL 15: SIGTERM
2015-08-04 09:34:32,143 INFO org.apache.tajo.worker.TajoWorker: ============================================
case1) 포트 / 프로세스 충돌 문제
마스터 노드에 가서 포트확인해보니 이렇다.
[user@test-001.com conf]$ sudo netstat -tpn | grep 26003
tcp 0 0 127.0.0.1:53783 127.0.0.1:26003 ESTABLISHED 15879/java
tcp 0 0 127.0.0.1:26003 127.0.0.1:53783 ESTABLISHED 15622/java
프로세스를 찾아야 해서 찾아보니, 내가테스트하느라 띄워놓은 단독모드로 띄워놓은 타조 데몬의 문제였다 ;;
[user@test-001.com conf]$ ps -ef | grep 15879
user 15879 1 0 Aug03 ? 00:01:29 /usr/java/jdk1.7.0_67-cloudera//bin/java -Dproc_worker -Djava.net.preferIPv4Stack=true -Xmx1000m -Dtajo.log.dir=/home1/user/minchul/tajo_solo/tajo-0.10.1/bin/../logs -Dtajo.log.file=tajo-user-worker-test-yura001.ncl.log -Dtajo.home.dir=/home1/user/minchul/tajo_solo/tajo-0.10.1/bin/.. -Dtajo.id.str=user -Dtajo.root.logger.appender=DRFA -Djava.library.path=/home1/cloudera/parcels/CDH/lib/hadoop/lib/native/ -Dtajo.policy.file=tajo-policy.xml org.apache.tajo.worker.TajoWorker
case2) tajo-work.xml 설정파일을 설정안하거나, ip나 host를 지정안했을 경우
참고로 worker에서 master에 붙지 못하는 경우
tajo.master.client-rpc.address , tajo.resource-tracker.rpc.address 관련해서 masternode 호스트나 ip를 지정안해서 그럴수도 있다
(기본적으로 localhost라서 외부에 연결이 안된다나)
또 주의할것이 tajo-work.xml 설정파일은 마스터랑 워커노드 있어야 한다.
case3) 마스터 기동 실패문제
그 이외에도 master에서 정상기동을 못해도 이런 에러가 날수 있다.
이땐 masternode의 master로그를 확인해봐야한다.
참고로 나같은 경우는 hdfs에 tajo 폴더를 만들때 권한있는 유저가 달라서 권한문제로 안된것이었다.