tajo 클러스터 세팅하는데 워커 노드에서 오류가 보인다.


2015-08-04 09:34:19,329 INFO org.apache.tajo.util.history.HistoryWriter: HistoryWriter_test-003.com_28093 started.

2015-08-04 09:34:19,384 WARN org.apache.tajo.rpc.NettyClientBase: 연결이 거부됨: test-001.com/10.10.10.1:26003 Try to reconnect

2015-08-04 09:34:20,386 WARN org.apache.tajo.rpc.NettyClientBase: 연결이 거부됨: test-001.com/10.10.10.1:26003 Try to reconnect

2015-08-04 09:34:21,389 WARN org.apache.tajo.rpc.NettyClientBase: 연결이 거부됨: test-001..com/10.10.10.1:26003 Try to reconnect

2015-08-04 09:34:22,393 ERROR org.apache.tajo.worker.WorkerHeartbeatService: Max retry count has been exceeded. attempts=3 caused by: java.net.ConnectException: 연결이 거부됨: test-001.com/10.10.10.1:26003

io.netty.channel.ConnectTimeoutException: Max retry count has been exceeded. attempts=3 caused by: java.net.ConnectException: 연결이 거부됨: test-001.com/10.10.10.1:26003

        at org.apache.tajo.rpc.NettyClientBase.doReconnect(NettyClientBase.java:139)

        at org.apache.tajo.rpc.NettyClientBase.connect(NettyClientBase.java:118)

        at org.apache.tajo.rpc.RpcClientManager.getClient(RpcClientManager.java:96)

        at org.apache.tajo.worker.WorkerHeartbeatService$WorkerHeartbeatThread.run(WorkerHeartbeatService.java:187)

2015-08-04 09:34:32,142 ERROR org.apache.tajo.worker.TajoWorker: RECEIVED SIGNAL 15: SIGTERM

2015-08-04 09:34:32,143 INFO org.apache.tajo.worker.TajoWorker: ============================================



case1) 포트 / 프로세스 충돌 문제 

마스터 노드에 가서 포트확인해보니 이렇다.

[user@test-001.com conf]$ sudo netstat -tpn | grep 26003

tcp        0      0 127.0.0.1:53783             127.0.0.1:26003             ESTABLISHED 15879/java

tcp        0      0 127.0.0.1:26003             127.0.0.1:53783             ESTABLISHED 15622/java


프로세스를 찾아야 해서 찾아보니, 내가테스트하느라 띄워놓은 단독모드로 띄워놓은 타조 데몬의 문제였다 ;;

[user@test-001.com conf]$ ps -ef | grep 15879

user     15879     1  0 Aug03 ?        00:01:29 /usr/java/jdk1.7.0_67-cloudera//bin/java -Dproc_worker -Djava.net.preferIPv4Stack=true -Xmx1000m -Dtajo.log.dir=/home1/user/minchul/tajo_solo/tajo-0.10.1/bin/../logs -Dtajo.log.file=tajo-user-worker-test-yura001.ncl.log -Dtajo.home.dir=/home1/user/minchul/tajo_solo/tajo-0.10.1/bin/.. -Dtajo.id.str=user -Dtajo.root.logger.appender=DRFA -Djava.library.path=/home1/cloudera/parcels/CDH/lib/hadoop/lib/native/ -Dtajo.policy.file=tajo-policy.xml org.apache.tajo.worker.TajoWorker




case2) tajo-work.xml 설정파일을 설정안하거나, ip나 host를 지정안했을 경우

참고로 worker에서 master에 붙지 못하는 경우 

tajo.master.client-rpc.address , tajo.resource-tracker.rpc.address 관련해서 masternode 호스트나 ip를 지정안해서 그럴수도 있다

(기본적으로 localhost라서 외부에 연결이 안된다나)

또 주의할것이 tajo-work.xml 설정파일은 마스터랑 워커노드 있어야 한다.



case3) 마스터 기동 실패문제

그 이외에도 master에서 정상기동을 못해도 이런 에러가 날수 있다.

이땐 masternode의 master로그를 확인해봐야한다. 

참고로 나같은 경우는 hdfs에 tajo 폴더를 만들때 권한있는 유저가 달라서 권한문제로 안된것이었다.



+ Recent posts