Background Image

FORUM

조회 수 9450 추천 수 0 댓글 3
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 CentOS 6.5 64bit
CUBRID Ver.
 CUBRID 2008 R4.3 (8.4.3.6001) (64bit release build for linux_gnu) (Aug  1 2014 10:20:56)
CUBRID TOOL Ver.

응용 환경(API)
 php 5.3.3
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


데이터베이스를 HA 구성하여 Active, Standby 로 운영 중입니다.


구성 후 Standby 서버에서 서비스가 중단되는 현상이 발생합니다.


다음은 관련 에러로그입니다.


1. Server error log

Time: 08/30/14 23:40:41.775 - ERROR *** file ../../src/connection/server_support.c, line 698 ERROR CODE = -989 Tran = 0, CLIENT = (unknown):(unknown)(-1), EID = 1

Process event: Disconnected with the cub_master and will shut itself down. 



2. DBNAME@localhost_applylogdb_DBNAME_nodeA.err

Time: 08/30/14 23:40:41.789 - ERROR *** file ../../src/communication/network_cl.c, line 4254 ERROR CODE = -186 Tran = 2, EID = 2

Error receiving data from server.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 195 ERROR CODE = -199 Tran = 2, EID = 3

Server no longer responding.... Invalid argument


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/transaction/transaction_cl.c, line 673 ERROR CODE = -111 Tran = 2, EID = 4

Your transaction has been aborted by the system due to server failure or mode change.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 1072 ERROR CODE = -199 Tran = -1, EID = 5

Server no longer responding.



3. DBNAME@nodeA_copylogdb.err

Time: 08/30/14 23:40:42.766 - ERROR *** file ../../src/connection/heartbeat.c, line 271 ERROR CODE = -989 Tran = 2, EID = 2

Process event: Disconnected with the cub_master and will shut itself down. 


Time: 08/30/14 23:41:00.242 - ERROR *** file ../../src/transaction/log_writer.c, line 1353 ERROR CODE = -1037 Tran = 2, EID = 3

log writer: log writer shut itself down by signal.




4. databases.txt 설정

DBNAME         /home/CUBRID/databases/DBNAME  nodeA:nodeB     /home/CUBRID/databases/DBNAME

  file:/home/CUBRID/databases/DBNAME/lob



5. /etc/hosts 설정

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6


192.168.127.95  nodeA

192.168.127.73  nodeB



동일하게 구성한 2그룹 중 한개의 그룹만 동일 문제가 2회 이상 발생했습니다.


해당 부분의 에러코드를 분석하려 했으나 원인을 찾지 못하겠습니다.


조언 부탁드립니다.

  • ?
    정만영 2014.09.02 02:28

    안녕하세요.

    마스터와 슬레이브간에 네트워크가 불안정해서 split-brain 현상이 발생한 문제로 판단 됩니다.

    $CUBRID/conf/cubrid_ha.conf 환경설정에 ha_ping_hosts=무정지IP 등록/추가 후 HA 재구동하여 서비스를 운영해 보세요.

    파라미터를 설정하면 불안정한 네트워크로 인해 상대 마스터 노드가 비정상 종료된 것으로 오인한 슬레이브 노드가 마스터 노드로 역할이 변경되면서 동시에 두 개의 마스터 노드가 존재하게 되는 split-brain 현상을 방지할 수 있습니다.

  • ?
    freemir 2014.09.02 03:02

    안녕하세요.


    해당 슬레이브 서비스가 중지된 당시에 서비스가 내려간 것으로 보이나 일부 프로세스가 구동 중인 현상이 있었습니다.

    split-brain이 발생하면 해당 서비스도 정상적으로 내려가야 하는 것이 아닌지 궁금합니다.


    root@nodeB:~# cubrid service status

    @ cubrid master status

    ++ cubrid master is not running.

    @ cubrid server status

    ++ cubrid master is not running.

    @ cubrid broker status

      NAME           PID  PORT  AS  JQ      REQ  TPS  QPS    LONG-T    LONG-Q  ERR-Q

    ================================================================================

    * query_editor  3949 30000   5   0        0    0    0    0/60.0    0/60.0      0

    * broker1       3959 33000   5   0        0    0    0    0/60.0    0/60.0      0

    @ cubrid manager server status

    ++ cubrid manager server is running.



    root@nodeB:~# cubrid hb status

    @ cubrid heartbeat list

    ++ cubrid master is not running.



    root@nodeB:~# ps axfww | grep cub

     57942 pts/1    S+     0:00          _ grep cub

      3949 ?        Sl     2:43 cub_broker

      3950 ?        S      0:00 query_editor_cub_cas_1

      3951 ?        S      0:00 query_editor_cub_cas_2

      3952 ?        S      0:00 query_editor_cub_cas_3

      3953 ?        S      0:00 query_editor_cub_cas_4

      3954 ?        S      0:00 query_editor_cub_cas_5

      3959 ?        Sl     2:53 cub_broker

      3960 ?        S      0:00 broker1_cub_cas_1

      3961 ?        S      0:00 broker1_cub_cas_2

      3962 ?        S      0:00 broker1_cub_cas_3

      3963 ?        S      0:00 broker1_cub_cas_4

      3964 ?        S      0:00 broker1_cub_cas_5

      3972 ?        Sl     0:10 cub_auto start

      3977 ?        Sl     0:41 cub_cmserver

      4044 ?        Ss     0:00 cub_cmhttpd

      4046 ?        S      0:00  _ cub_cmhttpd

      4045 ?        S      0:00 cub_js start

      6540 ?        S      0:23 cub_admin applylogdb -L /home/CUBRID/databases/DBNAME_nodeA --max-mem-size=500 DBNAME@localhost

  • ?
    정만영 2014.09.04 19:07

    안녕하세요.

    CUBRID HA 관련 프로세서는 cub_server, copylogdb, applylogdb로 브로커, 매니저는 HA정지 시 구동되어 있는 것이 정상입니다.

    ps로 확인한 결과에서 applylogdb 프로세서가 남아 있는데 kill로 applylogdb 프로세서만을 종료하시고 cubrid heartbeat start 구동하시면 HA가 정상 구동될 것입니다.

    수고하세요.



List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 CUBRID 사용자를 위한 DBeaver 도구 출시 안내 admin 2024.04.23 43
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 4458
1114 [PHP]CUBRID 연결 문제 6 php_user2 2016.01.29 6901
1113 [HA구성] master 서버 DOWN의 경우 4 큐스코 2015.12.02 6244
1112 [Cubrid HA] restoreslave 사용할 경우 Master/Slave 경로를 반드시 동일하게 맞춰야하나요? 1 큐브짱 2022.05.06 71
1111 [Cubrid 9.3] POSIX ERROR 문의 1 vasconcelos 2018.09.06 360
1110 [CUBRID Migration Toolkit 11.0-i386] 압축 해제 후 오류 1 jeinhe 2022.09.07 72
1109 [CUBRID Admin] 테이블 컬럼 순서 변경 불가 12 tree1891 2023.11.05 178
1108 [CUBRID Admin] 사용자의 테이블 권한 편집 1 tree1891 2023.11.06 97
1107 [CUBRID Admin] ENUM 데이터 내보내기 1 tree1891 2023.11.14 109
1106 [ADO.NET] Syntax error: unexpected 6 tree1891 2023.10.17 152
1105 [-830]Cannot allocate query entry any more. Maximun allocatable entries are 100 1 dasomoh 2021.01.07 225
1104 Your transaction (index 4, dba@LoveME|3952) has been unilaterally aborted by the system.큐브리드 로그파일도 같이 넣었어요.. 1 지니 2009.09.08 28016
1103 XE를 mysql에서 cubrid로 이전한 후 속도가 너무 느립니다. 22 엔하늘 2011.08.07 28568
1102 XE 이전에 관해... 15 sugarkane 2010.11.24 10616
1101 XADatasource 사용시 롤백 이슈 1 devcc 2022.03.22 112
1100 Windows10에서 Accessor is invalid 에러가 발생되는데, 확인좀 부탁드립니다. 4 file sec_smd 2018.12.07 425
1099 Windows 에서 사일런트 설치가 가능한가요... 2 거만쟁이 2009.08.12 23359
1098 Windows 버전 이중화 문의 드립니다. 2 배나와사마 2013.03.05 8455
1097 Windows Server 설치된 큐브리드 10.1.1.7691 의 loadjava.exe 실행 시 액세스가 거부되었습니다. 라는 메시지가 나오는 현상 3 노멤버 2018.06.25 323
1096 Windows Server 버전별 설치가능여부 확인 문의 2 언제나즐거운나 2015.05.26 7255
1095 Windows Server 2008 64Bit에서 Cubrid 2008 R2.2 사용 가능여부 5 종이 2010.12.16 8868
Board Pagination Prev 1 ... 140 141 142 143 144 145 146 147 148 149 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales