CUBRID HA 사용 중 Standby 서버 종료 현상

by freemir posted Sep 01, 2014

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 CentOS 6.5 64bit
CUBRID Ver.
 CUBRID 2008 R4.3 (8.4.3.6001) (64bit release build for linux_gnu) (Aug  1 2014 10:20:56)
CUBRID TOOL Ver.

응용 환경(API)
 php 5.3.3
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


데이터베이스를 HA 구성하여 Active, Standby 로 운영 중입니다.


구성 후 Standby 서버에서 서비스가 중단되는 현상이 발생합니다.


다음은 관련 에러로그입니다.


1. Server error log

Time: 08/30/14 23:40:41.775 - ERROR *** file ../../src/connection/server_support.c, line 698 ERROR CODE = -989 Tran = 0, CLIENT = (unknown):(unknown)(-1), EID = 1

Process event: Disconnected with the cub_master and will shut itself down. 



2. DBNAME@localhost_applylogdb_DBNAME_nodeA.err

Time: 08/30/14 23:40:41.789 - ERROR *** file ../../src/communication/network_cl.c, line 4254 ERROR CODE = -186 Tran = 2, EID = 2

Error receiving data from server.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 195 ERROR CODE = -199 Tran = 2, EID = 3

Server no longer responding.... Invalid argument


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/transaction/transaction_cl.c, line 673 ERROR CODE = -111 Tran = 2, EID = 4

Your transaction has been aborted by the system due to server failure or mode change.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 1072 ERROR CODE = -199 Tran = -1, EID = 5

Server no longer responding.



3. DBNAME@nodeA_copylogdb.err

Time: 08/30/14 23:40:42.766 - ERROR *** file ../../src/connection/heartbeat.c, line 271 ERROR CODE = -989 Tran = 2, EID = 2

Process event: Disconnected with the cub_master and will shut itself down. 


Time: 08/30/14 23:41:00.242 - ERROR *** file ../../src/transaction/log_writer.c, line 1353 ERROR CODE = -1037 Tran = 2, EID = 3

log writer: log writer shut itself down by signal.




4. databases.txt 설정

DBNAME         /home/CUBRID/databases/DBNAME  nodeA:nodeB     /home/CUBRID/databases/DBNAME

  file:/home/CUBRID/databases/DBNAME/lob



5. /etc/hosts 설정

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6


192.168.127.95  nodeA

192.168.127.73  nodeB



동일하게 구성한 2그룹 중 한개의 그룹만 동일 문제가 2회 이상 발생했습니다.


해당 부분의 에러코드를 분석하려 했으나 원인을 찾지 못하겠습니다.


조언 부탁드립니다.


Articles