Background Image

FORUM

조회 수 730 추천 수 0 댓글 8
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 Linux 64
CUBRID Ver.
CUBRID 9.3 (9.3.9.0002) (64bit release build for linux_gnu) (Aug  4 2017 11:55:22)
CUBRID TOOL Ver.
[도움말]-[버전정보] 확인
응용 환경(API)
java, php, odbc 등 입력

* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


서비스중인 Cubrid 서버가 갑자기 죽어버렸습니다.

현재 원인을 파악해보려고 하는데 어디서부터 봐야할지 감이 서질 않습니다.

단순하게 로그들만 살펴보면되는것인지 가이드가 필요한 상황입니다.


장애가 발생하고 cubrid service status 명령어를 통해서 확인했을때는

서비스는 돌아가고 있었고 마스터가 돌아가지 않는 상황이었습니다.


아래는 에러 로그입니다.


Time: 04/27/19 03:00:01.348 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/27/19 03:00:01.348 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



Time: 04/28/19 03:00:01.669 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/28/19 03:00:01.669 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



Time: 04/29/19 03:00:01.934 - ERROR *** file ../../src/connection/connection_cl.c, line 757 ERROR CODE = -353 Tran = -1, EID = 1

Cannot make connection to master server on host "localhost".... No such file or directory


Time: 04/29/19 03:00:01.934 - ERROR *** file ../../src/transaction/boot_cl.c, line 1743 ERROR CODE = -677 Tran = -1, EID = 2

Failed to connect to database server, 'db', on the following host(s): localhost


*** The previous error message is the last one. ***



======================

master.err


Time: 04/29/19 18:56:28.569 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***



Time: 04/29/19 19:00:52.347 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***



Time: 04/29/19 19:03:03.237 - ERROR *** file ../../src/connection/tcp.c, line 709 ERROR CODE = -357 Tran = -1, EID = 1

Cannot bind local address... aborting.... Address already in use


*** The previous error message is the last one. ***






  • ?
    큐브리드_김주현 2019.05.02 13:23
    안녕하세요. 큐브리드를 이용해 주셔서 감사합니다.

    master.err파일에 출력된 바와 같이 localhost부부분에 연결되지 못하면서 에러가 발생한 상황 같습니다.
    서버를 점검해보시고 03:00 이전과 이후에 어떠한 이슈가 있었는지 확인해 보셔야 하겠습니다.

    감사합니다.
  • ?
    K몽 2019.05.02 13:32
    로컬 호스트 부분에 연결되지 못했다는 말이 어떤의미인가요?
    어플리케이션에서 큐브리드 DB 쪽에 붙지 못했다는 말씀이신지..

    클라이언트쪽에 문제된 상황을 이야기해줘야하는 입장이라
    좀더 자세한 설명 부탁드립니다.
    또한 해당 문제가 마스터서버가 갑자기 죽어버린거랑 상관이 있는지도 궁금합니다.

    status 명령어를 통해서 확인했을때 마스터 서버가 돌아가지 않는 상황이었거든요..
  • ?
    큐브리드_김주현 2019.05.02 13:57
    에러 메시지로만 답변드린 것입니다.

    죄송하지만. 해당 메시지만으로 "마스터 서버가 갑자기 죽었다"의 원인을 파악하기에 무리가 있습니다.
    최초 구성환경과 구성 후 테스트 여부, 이슈 발생 시 어떠한 이슈나 작업 이 있었는지도 알아야 하며
    서버상태와 CUBRID 서비스 및 서버 상태도 알아야 파악이 가능할 것 으로 보입니다.

    몇 가지 점검사항으로 나열하자면,

    1) 서버의 dmesg등을 확인해보세요. 이슈 발생 시, 특이점은 없었는지 파악해 보세요
    2) /etc/hosts 파일이 변경되었는지 확인
    3) 마스터 서버가 죽었다고 하셨는데 해당 프로세스의 존재유무 확인 (ps -ef|grep cub_)
    4) CUBRID-HA구성 후 fail-over / fail-back테스트는 완료되었던 것인가요?
    5) CUBRID서비스를 모두 내리고, 프로세스(cub_*)를 확인 후, 재 구동 시켜보세요. 특이사항은 없는지 확인해 보세요

    감사합니다.
  • ?
    K몽 2019.05.02 16:01
    답변 감사드립니다.

    점검사항으로 나열해주신 항목중
    1번과 4번은 서버상의 직접적인 관리 권한이 없어서 확인하지 못한사항입니다.

    나머지 항목에 대해서는 다음과 같습니다.

    2.번은 확인결과 이상이 없었습니다.

    3번 같은경우 프로세스는 살아있었던것으로 기억합니다.
    또한 status 상에서의 마스터 서버는 구동되지 않는다고 나와있었으나, ps 명령어를 통해서 확인했을때는 프로세스가 실행되고있다고 나와있었습니다.
    (아래에 답변달린 명령어로(netstat -nlp | grep 1523 | grep tcp) 조1회 해봤을때 1523 cub_master 이 점유중인것으로 나와있었습니다.)

    5번같은경우 3번에서 ps 명령어로 프로세스가 살아있는지 확인했을때 살아있다고 나와있어서
    service stop 명령어를 통해 죽이고 다시 실행시키려고 햇었습니다.
    하지만 정상적으로 죽지 않아 kill 명령어를 통해서 프로세스를 강제로 죽이고 서비스를 올리니 정상적으로 올라갔습니다.
  • ?
    한기수 2019.05.02 14:04

    master server가 사용하는 기본 port가 1523/tcp 입니다.
    master.err를 보면 cub_master가 기동하면서 1523/tcp port가 다른 process에 의해
    사용중이기 때문에 실패한 것으로 나옵니다.
    [root shell]에서 'netstat -nlp | grep 1523 | grep tcp' 명령 실행하면 1523/tcp process가
    어떤 process에 의해 점유되어있는지 알 수 있습니다.


    정상이면 아래와 같이 나오거나 아무 message도 없어야 합니다.  

    만약 다른 process에 점유되었다면 맨 뒤의 argument에 점유하고 있는 프로그램명이 나올 것입니다.


    tcp        0      0 0.0.0.0:1523            0.0.0.0:*               LISTEN      5806/cub_master 


    회피 방법은 $CUBRID/conf/cubrid.conf 에서
    cubrid_port_id=1523 ==> 

    cubrid_port_id=31523 # 예, 사용하지 않는 port
    로 수정후 cubrid service를 재기동해보세요.

  • ?
    K몽 2019.05.02 16:04

    답변 감사합니다.
    안그래도 포트를 전체적으로 확인해봤습니다만, 정상적으로 cub_master 1523 포트를 점유중인것으로 나와있었습니다.

    아마 에러 로그에 찍힌거는 master 서버가 죽었다고 생각하고 제가 start 명령어를 날려서 로그가 남겨졌다고 볼수도 있겠네요.

    stop 후에 정상적으로 죽었다고 생각하고 start 했는데 ps 명령어로 확인해보니 master 프로세스가 정상적으로  stop 안되었더라구요..

  • ?
    오명환 2019.05.02 14:31
    ps -ef | grep cub_master 라는 명령어로 cub_master 프로세스가 구동되어 있는지 확인해 보세요.
    만약 cub_master process가 구동되어 있다면, /tmp의 permission이 cubrid를 구동한 user가 R/W가 되는지 확인하고, 만약 R/W가 안된다면 R/W permission을 할당해주세요.

    cubrid는 기본적으로 /tmp 아래에 unix domain socket 파일을 만들어서 사용합니다.
    localhost (즉, 127.0.01)과 같이 같은 서버에서 연결할 경우 unix domain socket 파일을 사용하는데, 이것에 R/W 권한이 없으면 아래와 같은 오류가 발생할 수 있습니다.
  • ?
    K몽 2019.05.02 16:02
    답변 감사합니다.
    해당 부분도 한번 확인해봐야겠네요^^

List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 4246
3956 Redhat 8버전 tls 1.0 에러 9 11시38분 2024.01.30 111
3955 테이블이 어떤 스키마(데이터베이스)에 속해있는지 알 수 있는 방법이 있나요? 3 엘L 2024.01.29 108
3954 테이블 생성시 REUSE_OID 옵션끄기 문의드립니다 1 원샷 2024.01.25 83
3953 큐브리드 DB에 테이블 생성 후, 저장된 데이터 LIKE 조건 안되는 현상입니다. 1 file 하코 2024.01.24 79
3952 실 ip db서버 이중화 관련 질문 1 zexpand 2024.01.18 81
3951 SQLGate for CUBRID (CUBRID v9.3 and later) 폐쇄망 사용법? 1 임소식 2024.01.18 69
3950 큐브리드 파일 읽기 쓰기 문의 1 임소식 2024.01.18 321
3949 CUBRID Manager 윈도우 버전 배포 해주세요. SQLGate for CUBRID 버그가 많아요. 2 도프 2024.01.17 92
3948 Cubird db 접속 문제 1 file 폰호두 2024.01.17 81
3947 Django Cubrid DB Conntection Error 4 thejoin 2024.01.16 90
3946 CUBRID DB 접속 불가 1 file 싸뤼 2024.01.16 75
3945 Cubrid admin localhost 연결 불가 7 file 싸뤼 2024.01.12 134
3944 파티션 테이블 성능 문의 4 file 방글이 2024.01.11 106
3943 트리거 삭제 오류 1 file slqk135 2024.01.08 86
3942 restoredb 시 log 내용 문의 1 file 별하나에 2024.01.08 63
3941 파티션 테이블 대량 DROP 처리 문의 (ibatis) 1 방글이 2024.01.04 72
3940 JAVA SP 에서 addBatch 오류 문의 1 방글이 2024.01.03 76
3939 DB서버 에러로그 1 file leeee 2023.12.27 111
3938 오라클의 SUBSTRB 기능 문의 3 방글이 2023.12.26 100
3937 멀티host상태에서 admin툴 로그인방법 문의합니다 2 file 원샷 2023.12.20 92
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 199 Next
/ 199

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales