* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
|
Rocky Linux 9.3 64bit |
|
CUBRID 10.1 (10.1.4.7800-ccdd47b) |
|
[도움말]-[버전정보] 확인 |
|
java, php, odbc 등 입력 |
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 | 재현 가능한 Source와 SQL |
관련 테이블(인덱스, 키정보 포함) 정보 | CUBRID 홈 디렉토리 아래 log 디렉토리 압축 |
-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
DB1(MASTER), DB2(SLAVE) HA 구성 후
1. /opt/cubrid/log/ 폴더 밑에 applepie@DB2_copylogdb.err 로그에 계속 log가 쌓입니다.
Time: 04/23/25 10:33:51.592 - ERROR *** file /home/jenkins/workspace/cubrid_release_10.1/src/communication/network_cl.c, line 185 ERROR CODE = -199, Tran = 2, EID = 40492
Server no longer responding.... Operation now in progress
Time: 04/23/25 10:33:51.592 - ERROR *** file /home/jenkins/workspace/cubrid_release_10.1/src/transaction/transaction_cl.c, line 535 ERROR CODE = -111, Tran = 2, EID = 40493
Your transaction has been aborted by the system due to server failure or mode change.
Time: 04/23/25 10:33:51.593 - NOTIFICATION *** file /home/jenkins/workspace/cubrid_release_10.1/src/transaction/log_writer.c, line 1101 CODE = -1040, Tran = -1, EID = 40494
HA generic: change the state of HA server (applepie@DB2) from 'standby' to 'dead'.
Time: 04/23/25 10:33:51.593 - ERROR *** file /home/jenkins/workspace/cubrid_release_10.1/src/communication/network_cl.c, line 185 ERROR CODE = -199, Tran = -1, EID = 40495
Server no longer responding.... Operation now in progress
2. 그리고 같은 경로에 applepie@localhost_applylogdb_applepie_DB2.err 해당 파일에도 대략 5초 단위로 로그가 계속 쌓입니다.(오류같아 보이진 않는데 err 파일에 쌓여서 문의드립니다.)
Time: 04/23/25 10:38:19.127 - NOTIFICATION *** file /home/jenkins/workspace/cubrid_release_10.1/src/transaction/log_applier.c, line 6358 CODE = -1040 Tran = 1, EID = 23233
HA generic: change the state of HA server (applepie@DB2) from 'standby' to 'dead'.
Time: 04/23/25 10:38:19.129 - NOTIFICATION *** file /home/jenkins/workspace/cubrid_release_10.1/src/transaction/log_applier.c, line 6452 CODE = -1040 Tran = 1, EID = 23234
HA generic: change log apply state from 'recovering' to 'done'. last committed LSA: 1173888|14880.
3. 그리고 같은 경로에 cub_client.err 해당 파일에도 로그가 계속 쌓입니다. (오류같아 보이진 않는데 err 파일에 쌓여서 문의드립니다.)
Time: 04/23/25 10:42:32.540 - NOTIFICATION *** file /home/jenkins/workspace/cubrid_release_10.1/src/transaction/boot_cl.c, line 1138 CODE = -971, Tran = -1, EID = 40811
Program 'copylogdb' (pid 770930) connected to database server 'applepie@DB2' on the host 'DB2' (port 1523).
1, 2, 3 같은 경우 로그가 당연히 쌓이는건가요? 아니면 진짜 오류가 나서 쌓이고 있는건가요?
DB1과 DB2 동기화는 잘되고 있습니다.
오류 로그 해석과 해결 방법 좀 알려주세요.
그리고 더 필요한게 있으시면 말씀해주시면 감사드립니다.
이상입니다. 수고하십시오.
감사합니다.
안녕하세요. 문의주신 CUBRID HA 환경에서 발생하는 .err 로그 파일에 대한 문의에 대해 아래와 같이 안내드립니다.
1. applepie@DB2_copylogdb.err 에러 로그
* -199 및 -111 에러는 HA 구성된 DB 간의 네트워크 문제 또는 DB2의 일시적인 비정상 상태로 인해 발생할 수 있습니다.
* -1040 코드는 HA 서버의 상태 전이 로그입니다. DB2가 standby 상태에서 dead 상태로 전환되었음을 알리는 메시지 입니다.
* 이 상황은 일시적인 연결 끊김 또는 모드 전환(예: failover 시도)과 같이 HA 환경에서는 자연스럽게 발생할 수 있는 이벤트입니다, 단, 너무 빈번하게 발생하는 경우 네트워크 연결 품질이나 DB2 HA 프로세스 동작 상태 점검과 데이터 동기화 상태 모니터링이 필요합니다.
2. applepie@localhost_applylogdb_applepie_DB2.err 로그
* log_applier는 복제 로그를 슬레이브 DB에 적용하는 프로세스입니다, 이 로그는 정상적인 복제 상태 전이 로그이며 오류로 간주되지 않습니다.
* 이 메시지가 일정 간격으로 반복되는 이유는 HA 로그 상태 모니터링 및 주기적인 상태 갱신 때문입니다, 이 경우는 정상적인 로그로 보이며, 별도 조치 없이 무시하셔도 됩니다.
3. cub_client.err 로그
* 해당 로그는 copylogdb 프로세스가 DB2에 정상적으로 접속했음을 알리는 정보성 알림 로그입니다.
* -971은 클라이언트 프로그램의 접속을 알리는 코드이며 오류가 아닙니다.
결론적으로 위 1, 2, 3번 로그 중 1번은 간헐적인 마스터/슬레이브 heartbeat 점검 시 아주 잠시 불안정 이슈로 인한 이벤트성 메시지이고 2, 3번은 정상적인 HA 동작 로그로 판단됩니다.
위 메시지가 너무 짧은 주기로 지속적으로 빈번하게 발생한다면 로그 시점에 다음 항목을 점검하시기 바랍니다:
1, DB2 서버의 자원 상태 (CPU, 메모리, 디스크 I/O 등)
2, DB2 서버와의 네트워크 연결 상태 (ping, 패킷 손실 여부)
3, CUBRID HA 프로세스 상태 및 데이터 동기화(프로세스 재구동이나 데이터 동기화 지연이 있는지)