Background Image

FORUM

조회 수 9451 추천 수 0 댓글 3
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 CentOS 6.5 64bit
CUBRID Ver.
 CUBRID 2008 R4.3 (8.4.3.6001) (64bit release build for linux_gnu) (Aug  1 2014 10:20:56)
CUBRID TOOL Ver.

응용 환경(API)
 php 5.3.3
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


데이터베이스를 HA 구성하여 Active, Standby 로 운영 중입니다.


구성 후 Standby 서버에서 서비스가 중단되는 현상이 발생합니다.


다음은 관련 에러로그입니다.


1. Server error log

Time: 08/30/14 23:40:41.775 - ERROR *** file ../../src/connection/server_support.c, line 698 ERROR CODE = -989 Tran = 0, CLIENT = (unknown):(unknown)(-1), EID = 1

Process event: Disconnected with the cub_master and will shut itself down. 



2. DBNAME@localhost_applylogdb_DBNAME_nodeA.err

Time: 08/30/14 23:40:41.789 - ERROR *** file ../../src/communication/network_cl.c, line 4254 ERROR CODE = -186 Tran = 2, EID = 2

Error receiving data from server.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 195 ERROR CODE = -199 Tran = 2, EID = 3

Server no longer responding.... Invalid argument


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/transaction/transaction_cl.c, line 673 ERROR CODE = -111 Tran = 2, EID = 4

Your transaction has been aborted by the system due to server failure or mode change.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 1072 ERROR CODE = -199 Tran = -1, EID = 5

Server no longer responding.



3. DBNAME@nodeA_copylogdb.err

Time: 08/30/14 23:40:42.766 - ERROR *** file ../../src/connection/heartbeat.c, line 271 ERROR CODE = -989 Tran = 2, EID = 2

Process event: Disconnected with the cub_master and will shut itself down. 


Time: 08/30/14 23:41:00.242 - ERROR *** file ../../src/transaction/log_writer.c, line 1353 ERROR CODE = -1037 Tran = 2, EID = 3

log writer: log writer shut itself down by signal.




4. databases.txt 설정

DBNAME         /home/CUBRID/databases/DBNAME  nodeA:nodeB     /home/CUBRID/databases/DBNAME

  file:/home/CUBRID/databases/DBNAME/lob



5. /etc/hosts 설정

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6


192.168.127.95  nodeA

192.168.127.73  nodeB



동일하게 구성한 2그룹 중 한개의 그룹만 동일 문제가 2회 이상 발생했습니다.


해당 부분의 에러코드를 분석하려 했으나 원인을 찾지 못하겠습니다.


조언 부탁드립니다.

  • ?
    정만영 2014.09.02 02:28

    안녕하세요.

    마스터와 슬레이브간에 네트워크가 불안정해서 split-brain 현상이 발생한 문제로 판단 됩니다.

    $CUBRID/conf/cubrid_ha.conf 환경설정에 ha_ping_hosts=무정지IP 등록/추가 후 HA 재구동하여 서비스를 운영해 보세요.

    파라미터를 설정하면 불안정한 네트워크로 인해 상대 마스터 노드가 비정상 종료된 것으로 오인한 슬레이브 노드가 마스터 노드로 역할이 변경되면서 동시에 두 개의 마스터 노드가 존재하게 되는 split-brain 현상을 방지할 수 있습니다.

  • ?
    freemir 2014.09.02 03:02

    안녕하세요.


    해당 슬레이브 서비스가 중지된 당시에 서비스가 내려간 것으로 보이나 일부 프로세스가 구동 중인 현상이 있었습니다.

    split-brain이 발생하면 해당 서비스도 정상적으로 내려가야 하는 것이 아닌지 궁금합니다.


    root@nodeB:~# cubrid service status

    @ cubrid master status

    ++ cubrid master is not running.

    @ cubrid server status

    ++ cubrid master is not running.

    @ cubrid broker status

      NAME           PID  PORT  AS  JQ      REQ  TPS  QPS    LONG-T    LONG-Q  ERR-Q

    ================================================================================

    * query_editor  3949 30000   5   0        0    0    0    0/60.0    0/60.0      0

    * broker1       3959 33000   5   0        0    0    0    0/60.0    0/60.0      0

    @ cubrid manager server status

    ++ cubrid manager server is running.



    root@nodeB:~# cubrid hb status

    @ cubrid heartbeat list

    ++ cubrid master is not running.



    root@nodeB:~# ps axfww | grep cub

     57942 pts/1    S+     0:00          _ grep cub

      3949 ?        Sl     2:43 cub_broker

      3950 ?        S      0:00 query_editor_cub_cas_1

      3951 ?        S      0:00 query_editor_cub_cas_2

      3952 ?        S      0:00 query_editor_cub_cas_3

      3953 ?        S      0:00 query_editor_cub_cas_4

      3954 ?        S      0:00 query_editor_cub_cas_5

      3959 ?        Sl     2:53 cub_broker

      3960 ?        S      0:00 broker1_cub_cas_1

      3961 ?        S      0:00 broker1_cub_cas_2

      3962 ?        S      0:00 broker1_cub_cas_3

      3963 ?        S      0:00 broker1_cub_cas_4

      3964 ?        S      0:00 broker1_cub_cas_5

      3972 ?        Sl     0:10 cub_auto start

      3977 ?        Sl     0:41 cub_cmserver

      4044 ?        Ss     0:00 cub_cmhttpd

      4046 ?        S      0:00  _ cub_cmhttpd

      4045 ?        S      0:00 cub_js start

      6540 ?        S      0:23 cub_admin applylogdb -L /home/CUBRID/databases/DBNAME_nodeA --max-mem-size=500 DBNAME@localhost

  • ?
    정만영 2014.09.04 19:07

    안녕하세요.

    CUBRID HA 관련 프로세서는 cub_server, copylogdb, applylogdb로 브로커, 매니저는 HA정지 시 구동되어 있는 것이 정상입니다.

    ps로 확인한 결과에서 applylogdb 프로세서가 남아 있는데 kill로 applylogdb 프로세서만을 종료하시고 cubrid heartbeat start 구동하시면 HA가 정상 구동될 것입니다.

    수고하세요.



List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 CUBRID 사용자를 위한 DBeaver 도구 출시 안내 admin 2024.04.23 119
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 4475
1000 아카이브 로그 정리 관련 6 기마누엘 2019.06.20 461
999 json 데이터타입 insert/update 1 임소현 2019.06.24 1419
998 DBA 권한 부여 방법 설명해주세요. 1 JIRAN 2019.07.01 1292
997 COMMMENT 추가 방법 좀 알려주십시오. 3 허접 2019.07.01 1214
996 Audit 테이블 따로 존재하나요? 3 JIRAN 2019.07.01 242
995 날짜 데이터 변환 1 옐인 2019.07.03 547
994 cannot fetch serial object 2 file happyday0393 2019.07.04 196
993 큐브리드 서비스 멈춘 뒤 DB 덮어씌기 후 서비스 재시작이 안되는 경우 1 민수킴 2019.07.08 167
992 큐브리드 매니저가 다운되지 않습니다. 1 퓨전남 2019.07.08 141
991 테이블명 대문자 문의드립니다. 1 jechoi 2019.07.09 621
990 cannot fetch serial object 두번째 문의 3 happyday0393 2019.07.09 216
989 DB table 별 용량 확인방법 문의합니다. 3 톨톨 2019.07.10 1478
988 프로시저와 함수 관련 질문이 있습니다... 1 bjosbkjx 2019.07.11 239
987 Mac mojave 버전 큐브리드 설치 문제 1 norman 2019.07.18 303
986 시점복구 왜 안될까요?? 1 kubrid 2019.07.20 256
985 예약어 관련하여 문의드립니다. 1 jechoi 2019.07.23 151
984 select문 실행시 칼럼명 구분콤마( , )가 없을때, 앞 칼럼의 데이터가 뒤 칼럼명의 데이터로 나오는 현상 2 유진욱 2019.07.23 429
983 JOIN (+)과 함수 에러 3 wewek3jk3 2019.07.24 260
982 큐브리드 매니저 툴(Mac Mojave) 편집 화면에서 쿼리 작성 시 키 타이핑 속도 못따라갈정도로 느린 이슈 2 norman 2019.07.24 389
981 큐브리드 매니저 가져오기 기능 오류 1 file 장두 2019.07.25 316
Board Pagination Prev 1 ... 146 147 148 149 150 151 152 153 154 155 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales