Background Image

FORUM

조회 수 121 추천 수 0 댓글 8
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 Linux 64
CUBRID Ver.
CUBRID 9.3 (9.3.9.0002) (64bit release build for linux_gnu) (Aug  4 2017 11:55:22)
CUBRID TOOL Ver.
[도움말]-[버전정보] 확인
응용 환경(API)
java, php, odbc 등 입력

* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


서비스중인 Cubrid 서버가 갑자기 죽어버렸습니다.

현재 원인을 파악해보려고 하는데 어디서부터 봐야할지 감이 서질 않습니다.

단순하게 로그들만 살펴보면되는것인지 가이드가 필요한 상황입니다.


장애가 발생하고 cubrid service status 명령어를 통해서 확인했을때는

서비스는 돌아가고 있었고 마스터가 돌아가지 않는 상황이었습니다.


아래는 에러 로그입니다.


Time: 04/27/19 03:00:01.348 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/27/19 03:00:01.348 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



Time: 04/28/19 03:00:01.669 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/28/19 03:00:01.669 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



Time: 04/29/19 03:00:01.934 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/29/19 03:00:01.934 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



======================

master.err


Time: 04/29/19 18:56:28.569 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***



Time: 04/29/19 19:00:52.347 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***



Time: 04/29/19 19:03:03.237 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***






  • ?
    큐브리드_김주현 2019.05.02 13:23
    안녕하세요. 큐브리드를 이용해 주셔서 감사합니다.

    master.err파일에 출력된 바와 같이 localhost부부분에 연결되지 못하면서 에러가 발생한 상황 같습니다.
    서버를 점검해보시고 03:00 이전과 이후에 어떠한 이슈가 있었는지 확인해 보셔야 하겠습니다.

    감사합니다.
  • ?
    K몽 2019.05.02 13:32
    로컬 호스트 부분에 연결되지 못했다는 말이 어떤의미인가요?
    어플리케이션에서 큐브리드 DB 쪽에 붙지 못했다는 말씀이신지..

    클라이언트쪽에 문제된 상황을 이야기해줘야하는 입장이라
    좀더 자세한 설명 부탁드립니다.
    또한 해당 문제가 마스터서버가 갑자기 죽어버린거랑 상관이 있는지도 궁금합니다.

    status 명령어를 통해서 확인했을때 마스터 서버가 돌아가지 않는 상황이었거든요..
  • ?
    큐브리드_김주현 2019.05.02 13:57
    에러 메시지로만 답변드린 것입니다.

    죄송하지만. 해당 메시지만으로 "마스터 서버가 갑자기 죽었다"의 원인을 파악하기에 무리가 있습니다.
    최초 구성환경과 구성 후 테스트 여부, 이슈 발생 시 어떠한 이슈나 작업 이 있었는지도 알아야 하며
    서버상태와 CUBRID 서비스 및 서버 상태도 알아야 파악이 가능할 것 으로 보입니다.

    몇 가지 점검사항으로 나열하자면,

    1) 서버의 dmesg등을 확인해보세요. 이슈 발생 시, 특이점은 없었는지 파악해 보세요
    2) /etc/hosts 파일이 변경되었는지 확인
    3) 마스터 서버가 죽었다고 하셨는데 해당 프로세스의 존재유무 확인 (ps -ef|grep cub_)
    4) CUBRID-HA구성 후 fail-over / fail-back테스트는 완료되었던 것인가요?
    5) CUBRID서비스를 모두 내리고, 프로세스(cub_*)를 확인 후, 재 구동 시켜보세요. 특이사항은 없는지 확인해 보세요

    감사합니다.
  • ?
    K몽 2019.05.02 16:01
    답변 감사드립니다.

    점검사항으로 나열해주신 항목중
    1번과 4번은 서버상의 직접적인 관리 권한이 없어서 확인하지 못한사항입니다.

    나머지 항목에 대해서는 다음과 같습니다.

    2.번은 확인결과 이상이 없었습니다.

    3번 같은경우 프로세스는 살아있었던것으로 기억합니다.
    또한 status 상에서의 마스터 서버는 구동되지 않는다고 나와있었으나, ps 명령어를 통해서 확인했을때는 프로세스가 실행되고있다고 나와있었습니다.
    (아래에 답변달린 명령어로(netstat -nlp | grep 1523 | grep tcp) 조1회 해봤을때 1523 cub_master 이 점유중인것으로 나와있었습니다.)

    5번같은경우 3번에서 ps 명령어로 프로세스가 살아있는지 확인했을때 살아있다고 나와있어서
    service stop 명령어를 통해 죽이고 다시 실행시키려고 햇었습니다.
    하지만 정상적으로 죽지 않아 kill 명령어를 통해서 프로세스를 강제로 죽이고 서비스를 올리니 정상적으로 올라갔습니다.
  • ?
    한기수 2019.05.02 14:04

    master server가 사용하는 기본 port가 1523/tcp 입니다.
    master.err를 보면 cub_master가 기동하면서 1523/tcp port가 다른 process에 의해
    사용중이기 때문에 실패한 것으로 나옵니다.
    [root shell]에서 'netstat -nlp | grep 1523 | grep tcp' 명령 실행하면 1523/tcp process가
    어떤 process에 의해 점유되어있는지 알 수 있습니다.


    정상이면 아래와 같이 나오거나 아무 message도 없어야 합니다.  

    만약 다른 process에 점유되었다면 맨 뒤의 argument에 점유하고 있는 프로그램명이 나올 것입니다.


    tcp        0      0 0.0.0.0:1523            0.0.0.0:*               LISTEN      5806/cub_master 


    회피 방법은 $CUBRID/conf/cubrid.conf 에서
    cubrid_port_id=1523 ==> 

    cubrid_port_id=31523 # 예, 사용하지 않는 port
    로 수정후 cubrid service를 재기동해보세요.

  • ?
    K몽 2019.05.02 16:04

    답변 감사합니다.
    안그래도 포트를 전체적으로 확인해봤습니다만, 정상적으로 cub_master 1523 포트를 점유중인것으로 나와있었습니다.

    아마 에러 로그에 찍힌거는 master 서버가 죽었다고 생각하고 제가 start 명령어를 날려서 로그가 남겨졌다고 볼수도 있겠네요.

    stop 후에 정상적으로 죽었다고 생각하고 start 했는데 ps 명령어로 확인해보니 master 프로세스가 정상적으로  stop 안되었더라구요..

  • ?
    오명환 2019.05.02 14:31
    ps -ef | grep cub_master 라는 명령어로 cub_master 프로세스가 구동되어 있는지 확인해 보세요.
    만약 cub_master process가 구동되어 있다면, /tmp의 permission이 cubrid를 구동한 user가 R/W가 되는지 확인하고, 만약 R/W가 안된다면 R/W permission을 할당해주세요.

    cubrid는 기본적으로 /tmp 아래에 unix domain socket 파일을 만들어서 사용합니다.
    localhost (즉, 127.0.01)과 같이 같은 서버에서 연결할 경우 unix domain socket 파일을 사용하는데, 이것에 R/W 권한이 없으면 아래와 같은 오류가 발생할 수 있습니다.
  • ?
    K몽 2019.05.02 16:02
    답변 감사합니다.
    해당 부분도 한번 확인해봐야겠네요^^

List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 SQLGate for CUBRID를 사용해 보시기 바랍니다!!! file admin 2019.07.31 161
84 문의 1 secret 수진이2 2015.05.09 9
83 오라클 -> 큐브리드 작업중 DB JOB 관련 1 secret 아코 2015.05.26 9
82 볼륨 생성 오류 4 secret 김수민 2015.06.29 9
81 Standalone 2 secret 델몬트 2015.08.19 9
80 이중화 구성시 펑션 class 위치 1 secret 차차오 2015.10.19 9
79 다시 문의드립니다. 1 secret centosm 2016.01.12 9
78 큐브리드 복구 관련 질문 있습니다. 2 secret 노멤버 2016.12.09 9
77 큐브리드 설정 관련 질문드립니다. secret 안산혀눙이 2017.08.08 9
76 CUBRID-8.1.4.1032-linux 완전삭제 방법 1 secret rupee76 2009.06.25 9
75 DB 백업 복구 시 오류 확인 요청 1 secret 삼돌이 2012.10.23 9
74 데이터 보안기능 문의 1 secret hareton 2009.07.01 8
73 OLE DB에서 자바 저장프로시져 사용 1 secret shadow54 2010.07.19 8
72 OLE DB에서 자바 저장프로시져 사용 1 secret shadow54 2010.07.20 8
71 쿼리 질문드립니다. 1 secret 질문있어요 2013.02.21 8
70 9.1 버전 설치 후 오류 문의 2 secret 장경수 2013.07.09 8
69 답변 부탁드립니다 _ _) 1 secret 오니오니 2013.11.23 8
68 Connection to ~ refused 관련 문의드립니다. 4 secret dashbell 2014.07.04 8
67 윈도우7일때 로컬엔진으로 접속하면 에러납니다. 1 secret 어려운큐브 2014.07.17 8
66 broker status 결과에 질문 다시드립니다... 1 secret 오니오니 2014.08.28 8
65 db다운 문제 1 secret chocob 2014.12.01 8
Board Pagination Prev 1 ... 144 145 146 147 148 149 150 151 152 153 Next
/ 153

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2147 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales