Background Image

Forum

조회 수 104 추천 수 0 댓글 8
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 Linux 64
CUBRID Ver.
CUBRID 9.3 (9.3.9.0002) (64bit release build for linux_gnu) (Aug  4 2017 11:55:22)
CUBRID TOOL Ver.
[도움말]-[버전정보] 확인
응용 환경(API)
java, php, odbc 등 입력

* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


서비스중인 Cubrid 서버가 갑자기 죽어버렸습니다.

현재 원인을 파악해보려고 하는데 어디서부터 봐야할지 감이 서질 않습니다.

단순하게 로그들만 살펴보면되는것인지 가이드가 필요한 상황입니다.


장애가 발생하고 cubrid service status 명령어를 통해서 확인했을때는

서비스는 돌아가고 있었고 마스터가 돌아가지 않는 상황이었습니다.


아래는 에러 로그입니다.


Time: 04/27/19 03:00:01.348 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/27/19 03:00:01.348 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



Time: 04/28/19 03:00:01.669 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/28/19 03:00:01.669 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



Time: 04/29/19 03:00:01.934 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/29/19 03:00:01.934 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



======================

master.err


Time: 04/29/19 18:56:28.569 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***



Time: 04/29/19 19:00:52.347 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***



Time: 04/29/19 19:03:03.237 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***






  • ?
    큐브리드_김주현 2019.05.02 13:23
    안녕하세요. 큐브리드를 이용해 주셔서 감사합니다.

    master.err파일에 출력된 바와 같이 localhost부부분에 연결되지 못하면서 에러가 발생한 상황 같습니다.
    서버를 점검해보시고 03:00 이전과 이후에 어떠한 이슈가 있었는지 확인해 보셔야 하겠습니다.

    감사합니다.
  • ?
    K몽 2019.05.02 13:32
    로컬 호스트 부분에 연결되지 못했다는 말이 어떤의미인가요?
    어플리케이션에서 큐브리드 DB 쪽에 붙지 못했다는 말씀이신지..

    클라이언트쪽에 문제된 상황을 이야기해줘야하는 입장이라
    좀더 자세한 설명 부탁드립니다.
    또한 해당 문제가 마스터서버가 갑자기 죽어버린거랑 상관이 있는지도 궁금합니다.

    status 명령어를 통해서 확인했을때 마스터 서버가 돌아가지 않는 상황이었거든요..
  • ?
    큐브리드_김주현 2019.05.02 13:57
    에러 메시지로만 답변드린 것입니다.

    죄송하지만. 해당 메시지만으로 "마스터 서버가 갑자기 죽었다"의 원인을 파악하기에 무리가 있습니다.
    최초 구성환경과 구성 후 테스트 여부, 이슈 발생 시 어떠한 이슈나 작업 이 있었는지도 알아야 하며
    서버상태와 CUBRID 서비스 및 서버 상태도 알아야 파악이 가능할 것 으로 보입니다.

    몇 가지 점검사항으로 나열하자면,

    1) 서버의 dmesg등을 확인해보세요. 이슈 발생 시, 특이점은 없었는지 파악해 보세요
    2) /etc/hosts 파일이 변경되었는지 확인
    3) 마스터 서버가 죽었다고 하셨는데 해당 프로세스의 존재유무 확인 (ps -ef|grep cub_)
    4) CUBRID-HA구성 후 fail-over / fail-back테스트는 완료되었던 것인가요?
    5) CUBRID서비스를 모두 내리고, 프로세스(cub_*)를 확인 후, 재 구동 시켜보세요. 특이사항은 없는지 확인해 보세요

    감사합니다.
  • ?
    K몽 2019.05.02 16:01
    답변 감사드립니다.

    점검사항으로 나열해주신 항목중
    1번과 4번은 서버상의 직접적인 관리 권한이 없어서 확인하지 못한사항입니다.

    나머지 항목에 대해서는 다음과 같습니다.

    2.번은 확인결과 이상이 없었습니다.

    3번 같은경우 프로세스는 살아있었던것으로 기억합니다.
    또한 status 상에서의 마스터 서버는 구동되지 않는다고 나와있었으나, ps 명령어를 통해서 확인했을때는 프로세스가 실행되고있다고 나와있었습니다.
    (아래에 답변달린 명령어로(netstat -nlp | grep 1523 | grep tcp) 조1회 해봤을때 1523 cub_master 이 점유중인것으로 나와있었습니다.)

    5번같은경우 3번에서 ps 명령어로 프로세스가 살아있는지 확인했을때 살아있다고 나와있어서
    service stop 명령어를 통해 죽이고 다시 실행시키려고 햇었습니다.
    하지만 정상적으로 죽지 않아 kill 명령어를 통해서 프로세스를 강제로 죽이고 서비스를 올리니 정상적으로 올라갔습니다.
  • ?
    한기수 2019.05.02 14:04

    master server가 사용하는 기본 port가 1523/tcp 입니다.
    master.err를 보면 cub_master가 기동하면서 1523/tcp port가 다른 process에 의해
    사용중이기 때문에 실패한 것으로 나옵니다.
    [root shell]에서 'netstat -nlp | grep 1523 | grep tcp' 명령 실행하면 1523/tcp process가
    어떤 process에 의해 점유되어있는지 알 수 있습니다.


    정상이면 아래와 같이 나오거나 아무 message도 없어야 합니다.  

    만약 다른 process에 점유되었다면 맨 뒤의 argument에 점유하고 있는 프로그램명이 나올 것입니다.


    tcp        0      0 0.0.0.0:1523            0.0.0.0:*               LISTEN      5806/cub_master 


    회피 방법은 $CUBRID/conf/cubrid.conf 에서
    cubrid_port_id=1523 ==> 

    cubrid_port_id=31523 # 예, 사용하지 않는 port
    로 수정후 cubrid service를 재기동해보세요.

  • ?
    K몽 2019.05.02 16:04

    답변 감사합니다.
    안그래도 포트를 전체적으로 확인해봤습니다만, 정상적으로 cub_master 1523 포트를 점유중인것으로 나와있었습니다.

    아마 에러 로그에 찍힌거는 master 서버가 죽었다고 생각하고 제가 start 명령어를 날려서 로그가 남겨졌다고 볼수도 있겠네요.

    stop 후에 정상적으로 죽었다고 생각하고 start 했는데 ps 명령어로 확인해보니 master 프로세스가 정상적으로  stop 안되었더라구요..

  • ?
    오명환 2019.05.02 14:31
    ps -ef | grep cub_master 라는 명령어로 cub_master 프로세스가 구동되어 있는지 확인해 보세요.
    만약 cub_master process가 구동되어 있다면, /tmp의 permission이 cubrid를 구동한 user가 R/W가 되는지 확인하고, 만약 R/W가 안된다면 R/W permission을 할당해주세요.

    cubrid는 기본적으로 /tmp 아래에 unix domain socket 파일을 만들어서 사용합니다.
    localhost (즉, 127.0.01)과 같이 같은 서버에서 연결할 경우 unix domain socket 파일을 사용하는데, 이것에 R/W 권한이 없으면 아래와 같은 오류가 발생할 수 있습니다.
  • ?
    K몽 2019.05.02 16:02
    답변 감사합니다.
    해당 부분도 한번 확인해봐야겠네요^^

List of Articles
번호 제목 글쓴이 날짜 조회 수
2996 시스템 카탈로그를 이용해서 FK 참조 테이블 및 컬럼의 정보를 확인하는 방법 3 ermekia 2019.05.29 54
2995 db시작이 안됩니다.. 2 SR 2019.05.24 70
2994 Cubrid Replica 구성 및 기타 에러 관련 문의드립니다. 3 IMMvp 2019.05.24 41
2993 큐브리드 포트포워딩 질문입니다.. 2 KunAguero 2019.05.23 41
2992 오라클 ==> cubrid로 마이그레이션 시 데이터 누락 2 도하준빠 2019.05.23 64
2991 뷰테이블 select 오류 3 한넷개발자 2019.05.23 39
2990 실행 오류 : -1016 문의드립니다. 4 동건 2019.05.23 43
2989 ORDER BY ** ASC 조건과 offset 조건이 같이 있을 경우 발생되는 오류 문의 7 file 충이 2019.05.22 40
2988 demodb에 데이터볼륨을 추가하려는데 에러가 발생해서 질문드립니다. 2 IMMvp 2019.05.20 34
2987 Cubrid문제 1 kor0654 2019.05.17 45
2986 패스워드 암호화 알고리즘 1 igloojs 2019.05.17 40
2985 ORACLE의 DBMS_XMLGEN.GETXMLTYPE를 CUBRID 변형 방법 요청 1 Rkakrnl 2019.05.16 36
2984 HA 구성에서 로그 삭제 방법 1 장두 2019.05.14 43
2983 계정 패스워드 암호화 방식 sha-2 지원 여부 1 igloojs 2019.05.10 43
2982 큐브리드 가져오기 질문입니다. 2 뚜벅초 2019.05.07 44
2981 큐브리드 구조 문의 드립니다. 1 호롤롤러얌 2019.05.04 47
2980 DB삭제 오류 관련 문의 3 file sklee 2019.05.02 66
» 마스터 서버가 갑자기 죽어버렸습니다 8 K몽 2019.05.02 104
2978 Cubrid 2008 R2.2 1 일조 2019.04.30 28
2977 엑셀파일로 데이터넣을때 질문입니다 1 file 왜안왔어 2019.04.29 52
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 151 Next
/ 151

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2147 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales