Background Image

FORUM

조회 수 9450 추천 수 0 댓글 3
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 CentOS 6.5 64bit
CUBRID Ver.
 CUBRID 2008 R4.3 (8.4.3.6001) (64bit release build for linux_gnu) (Aug  1 2014 10:20:56)
CUBRID TOOL Ver.

응용 환경(API)
 php 5.3.3
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


데이터베이스를 HA 구성하여 Active, Standby 로 운영 중입니다.


구성 후 Standby 서버에서 서비스가 중단되는 현상이 발생합니다.


다음은 관련 에러로그입니다.


1. Server error log

Time: 08/30/14 23:40:41.775 - ERROR *** file ../../src/connection/server_support.c, line 698 ERROR CODE = -989 Tran = 0, CLIENT = (unknown):(unknown)(-1), EID = 1

Process event: Disconnected with the cub_master and will shut itself down. 



2. DBNAME@localhost_applylogdb_DBNAME_nodeA.err

Time: 08/30/14 23:40:41.789 - ERROR *** file ../../src/communication/network_cl.c, line 4254 ERROR CODE = -186 Tran = 2, EID = 2

Error receiving data from server.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 195 ERROR CODE = -199 Tran = 2, EID = 3

Server no longer responding.... Invalid argument


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/transaction/transaction_cl.c, line 673 ERROR CODE = -111 Tran = 2, EID = 4

Your transaction has been aborted by the system due to server failure or mode change.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 1072 ERROR CODE = -199 Tran = -1, EID = 5

Server no longer responding.



3. DBNAME@nodeA_copylogdb.err

Time: 08/30/14 23:40:42.766 - ERROR *** file ../../src/connection/heartbeat.c, line 271 ERROR CODE = -989 Tran = 2, EID = 2

Process event: Disconnected with the cub_master and will shut itself down. 


Time: 08/30/14 23:41:00.242 - ERROR *** file ../../src/transaction/log_writer.c, line 1353 ERROR CODE = -1037 Tran = 2, EID = 3

log writer: log writer shut itself down by signal.




4. databases.txt 설정

DBNAME         /home/CUBRID/databases/DBNAME  nodeA:nodeB     /home/CUBRID/databases/DBNAME

  file:/home/CUBRID/databases/DBNAME/lob



5. /etc/hosts 설정

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6


192.168.127.95  nodeA

192.168.127.73  nodeB



동일하게 구성한 2그룹 중 한개의 그룹만 동일 문제가 2회 이상 발생했습니다.


해당 부분의 에러코드를 분석하려 했으나 원인을 찾지 못하겠습니다.


조언 부탁드립니다.

  • ?
    정만영 2014.09.02 02:28

    안녕하세요.

    마스터와 슬레이브간에 네트워크가 불안정해서 split-brain 현상이 발생한 문제로 판단 됩니다.

    $CUBRID/conf/cubrid_ha.conf 환경설정에 ha_ping_hosts=무정지IP 등록/추가 후 HA 재구동하여 서비스를 운영해 보세요.

    파라미터를 설정하면 불안정한 네트워크로 인해 상대 마스터 노드가 비정상 종료된 것으로 오인한 슬레이브 노드가 마스터 노드로 역할이 변경되면서 동시에 두 개의 마스터 노드가 존재하게 되는 split-brain 현상을 방지할 수 있습니다.

  • ?
    freemir 2014.09.02 03:02

    안녕하세요.


    해당 슬레이브 서비스가 중지된 당시에 서비스가 내려간 것으로 보이나 일부 프로세스가 구동 중인 현상이 있었습니다.

    split-brain이 발생하면 해당 서비스도 정상적으로 내려가야 하는 것이 아닌지 궁금합니다.


    root@nodeB:~# cubrid service status

    @ cubrid master status

    ++ cubrid master is not running.

    @ cubrid server status

    ++ cubrid master is not running.

    @ cubrid broker status

      NAME           PID  PORT  AS  JQ      REQ  TPS  QPS    LONG-T    LONG-Q  ERR-Q

    ================================================================================

    * query_editor  3949 30000   5   0        0    0    0    0/60.0    0/60.0      0

    * broker1       3959 33000   5   0        0    0    0    0/60.0    0/60.0      0

    @ cubrid manager server status

    ++ cubrid manager server is running.



    root@nodeB:~# cubrid hb status

    @ cubrid heartbeat list

    ++ cubrid master is not running.



    root@nodeB:~# ps axfww | grep cub

     57942 pts/1    S+     0:00          _ grep cub

      3949 ?        Sl     2:43 cub_broker

      3950 ?        S      0:00 query_editor_cub_cas_1

      3951 ?        S      0:00 query_editor_cub_cas_2

      3952 ?        S      0:00 query_editor_cub_cas_3

      3953 ?        S      0:00 query_editor_cub_cas_4

      3954 ?        S      0:00 query_editor_cub_cas_5

      3959 ?        Sl     2:53 cub_broker

      3960 ?        S      0:00 broker1_cub_cas_1

      3961 ?        S      0:00 broker1_cub_cas_2

      3962 ?        S      0:00 broker1_cub_cas_3

      3963 ?        S      0:00 broker1_cub_cas_4

      3964 ?        S      0:00 broker1_cub_cas_5

      3972 ?        Sl     0:10 cub_auto start

      3977 ?        Sl     0:41 cub_cmserver

      4044 ?        Ss     0:00 cub_cmhttpd

      4046 ?        S      0:00  _ cub_cmhttpd

      4045 ?        S      0:00 cub_js start

      6540 ?        S      0:23 cub_admin applylogdb -L /home/CUBRID/databases/DBNAME_nodeA --max-mem-size=500 DBNAME@localhost

  • ?
    정만영 2014.09.04 19:07

    안녕하세요.

    CUBRID HA 관련 프로세서는 cub_server, copylogdb, applylogdb로 브로커, 매니저는 HA정지 시 구동되어 있는 것이 정상입니다.

    ps로 확인한 결과에서 applylogdb 프로세서가 남아 있는데 kill로 applylogdb 프로세서만을 종료하시고 cubrid heartbeat start 구동하시면 HA가 정상 구동될 것입니다.

    수고하세요.



List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 CUBRID 사용자를 위한 DBeaver 도구 출시 안내 admin 2024.04.23 31
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 4457
1012 Spatial Extensions 지원하나요? 2 온니발란스 2010.02.09 14299
1011 SYS_TIME 출력 시 문의사항 1 오렌지 2021.07.01 147
1010 SYSTEM PARAMETERS 확인방법이 있나요? 1 봉보로봉봉 2017.07.29 453
1009 SUBQUERY 튜닝 관련 문의 6 secret yscoma 2017.03.30 20
1008 SSL 혹은 SSH와 같이 암호화 커넥션을 지원하나요? 1 아장아장 2010.09.03 12990
1007 SQL질문 1 마이나스 2010.11.05 7143
1006 SQL작성시 버벅거림 문의드립니다. 1 file 용이닷 2015.09.09 5816
1005 SQL문에 대해 질문 드립니다.. 5 ohgeumjin 2020.05.29 116
1004 SQL문 문의 2 아라천 2015.12.16 5155
1003 SQLGate에서 서버오류 발생합니다 1 file 두듀두듀듀 2022.10.09 104
1002 SQLGate 데이터 내보내기 오류 1 써늬니 2022.10.25 167
1001 SQLGate for CUBRID (CUBRID v9.3 and later) 폐쇄망 사용법? 1 임소식 2024.01.18 78
1000 SQLGate Developer 업데이트 후 오류 1 문태환 2021.11.15 169
999 SQL 행, 10분이상 지연 시 해제 및 설정 방법 문의 드립니다 2 kdman 2023.12.06 107
998 SQL 쿼리 속도문제 1 칭칭이 2013.10.17 10314
997 SQL 질문 1 삼월토끼 2014.05.12 6957
996 SQL 인라인뷰 응답속도 개선 문의 6 knight 2013.12.07 13270
995 SQL 에러 질문 1 카르마 2010.10.16 9958
994 SQL 에러 문의드립니다. 1 k.. 2012.08.04 15532
Board Pagination Prev 1 ... 145 146 147 148 149 150 151 152 153 154 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales