Background Image

FORUM

조회 수 188 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄


* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.

OS
Redhat 7.6 Enterprise
CUBRID Ver.
10.1.5.7809
CUBRID TOOL Ver.
10.2.0.0001
응용 환경(API)
JAVA


* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.

 

에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
 

안녕하세요. 현재 가상화 서버 2대를 HA 구성하여 운영중에 있습니다.

현재 새벽마다 hb_thread_check_disk_failure 오류가 발생하고 있습니다.

ha_ping_hosts 옵션은 추가되어있는 상태입니다.

 

원인이 어떤것인지, 어떻게 해결해야할지 잘 모르겠어서 문의드립니다.

 

시스템 로그(/var/log/messages)에서 확인된 오류는 아래와 같습니다.

#DB01 Master 서버

May 10 01:02:39

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 10 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffff9b2831fb4200        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff918d2ba0>] ? task_rq_unlock+0x20/0x20

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

 

#DB02 Slave 서버

May 10 01:05:31

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

 

-------- 다음날 새벽 --------

 

#DB01 Master 서버

May 11 01:03:09

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 11 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

May 11 01:08:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

#DB02 Slave 서버

오류 로그 없음.

 

  • ?
    오명환 2022.05.11 13:51
    올려주신 메세지를 보면 사용하는 시스템에서 해당 시간대에 fsync 수행시 file system이 block되는 현상이 발생하는 것 같습니다.
    $CUBRID/conf/cubrid.conf의 설정값 중 ha_check_disk_failure_interval의 기본값은 15초입니다.
    즉, 15초동안 disk 관련 행위에 응답이 없으면, timeout이 발생하여 fail-over가 발생합니다.

    우선적으로 해당 시간대에 어떤 행위에 의해 file system이 block되는지 원인을 파악해보세요.
    차선잭으로는 cubrid.conf의 ha_check_disk_failure_interval 의 값을 늘려보세요. (설정값을 적용하려면 restart 하셔야 합니다.)

  1. No Image notice by admin 2024/04/23 by admin
    Views 119 

    CUBRID 사용자를 위한 DBeaver 도구 출시 안내

  2. SQLGate for CUBRID 영구 무료 라이선스 제공

  3. cmt 툴 실행 시 아무런 응답 없음.

  4. 쉘스크립트에서 큐브리드 접속

  5. 11.2 jdbc driver

  6. cubridserviceTray 실행이 안됩니다..

  7. 데이터가져오기] 줄바꿈 데이터

  8. 큐브리드 매니저 저장 프로시저

  9. restoredb 관련하여 코드셋 문제 문의

  10. TimeZone 관련 질문

  11. 큐브리드 내보내기 관련하여 문의드립니다.

  12. cubrid는 처음 써보는데 궁금한 점이 있네요

  13. ODBC SQLBindParameter ArrayLoad시, 쓰레기값이 붙어 나오는 현상

  14. loaddb명령으로 sql파일 입력시 pk의 데이터가 중복일 경우에 대한 대처가 가능한 명령문을 알려주시면 감사하겠습니다.

  15. 함수 문의

  16. 복구가 일부만 되었습니다.

  17. 큐브리드 ha master-replica 구성시 clob 필드가 업데이드 되지 않는 거 같습니다.

  18. 큐브리드 백업과 삭제 cron 자동 설정

  19. Program 'spacedb' (pid 5835) was connected from the host 'localhost.localdomain'

  20. cubrid tool 문의

  21. 큐브리드 ha 구성 중에 master DB가 올라오지 않습니다.

  22. 안녕하세요 큐브리드 재설치 후 '가져오기' 및 INSERT된 데이터 오류 문의드립니다.

Board Pagination Prev 1 ... 14 15 16 17 18 19 20 21 22 23 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales