Background Image

FORUM

조회 수 187 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄


* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.

OS
Redhat 7.6 Enterprise
CUBRID Ver.
10.1.5.7809
CUBRID TOOL Ver.
10.2.0.0001
응용 환경(API)
JAVA


* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.

 

에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
 

안녕하세요. 현재 가상화 서버 2대를 HA 구성하여 운영중에 있습니다.

현재 새벽마다 hb_thread_check_disk_failure 오류가 발생하고 있습니다.

ha_ping_hosts 옵션은 추가되어있는 상태입니다.

 

원인이 어떤것인지, 어떻게 해결해야할지 잘 모르겠어서 문의드립니다.

 

시스템 로그(/var/log/messages)에서 확인된 오류는 아래와 같습니다.

#DB01 Master 서버

May 10 01:02:39

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 10 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffff9b2831fb4200        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff918d2ba0>] ? task_rq_unlock+0x20/0x20

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

 

#DB02 Slave 서버

May 10 01:05:31

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

 

-------- 다음날 새벽 --------

 

#DB01 Master 서버

May 11 01:03:09

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 11 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

May 11 01:08:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

#DB02 Slave 서버

오류 로그 없음.

 

  • ?
    오명환 2022.05.11 13:51
    올려주신 메세지를 보면 사용하는 시스템에서 해당 시간대에 fsync 수행시 file system이 block되는 현상이 발생하는 것 같습니다.
    $CUBRID/conf/cubrid.conf의 설정값 중 ha_check_disk_failure_interval의 기본값은 15초입니다.
    즉, 15초동안 disk 관련 행위에 응답이 없으면, timeout이 발생하여 fail-over가 발생합니다.

    우선적으로 해당 시간대에 어떤 행위에 의해 file system이 block되는지 원인을 파악해보세요.
    차선잭으로는 cubrid.conf의 ha_check_disk_failure_interval 의 값을 늘려보세요. (설정값을 적용하려면 restart 하셔야 합니다.)

  1. SQLGate for CUBRID 영구 무료 라이선스 제공

    Date2020.04.09 Byadmin Views4443
    read more
  2. 복구가 일부만 되었습니다.

    Date2022.05.16 By도우너19 Views181
    Read More
  3. 큐브리드 ha master-replica 구성시 clob 필드가 업데이드 되지 않는 거 같습니다.

    Date2022.05.16 Bysamsam Views138
    Read More
  4. 큐브리드 백업과 삭제 cron 자동 설정

    Date2022.05.16 By도우너19 Views216
    Read More
  5. Program 'spacedb' (pid 5835) was connected from the host 'localhost.localdomain'

    Date2022.05.16 By도우너19 Views158
    Read More
  6. cubrid tool 문의

    Date2022.05.13 Byamostella Views67
    Read More
  7. 큐브리드 ha 구성 중에 master DB가 올라오지 않습니다.

    Date2022.05.12 Bysamsam Views306
    Read More
  8. 안녕하세요 큐브리드 재설치 후 '가져오기' 및 INSERT된 데이터 오류 문의드립니다.

    Date2022.05.12 By큐브짱 Views141
    Read More
  9. 날짜 형식 변환

    Date2022.05.11 By밍아 Views82
    Read More
  10. terminate called after throwing an instance of 'std::bad_alloc'

    Date2022.05.11 By영웅찬 Views275
    Read More
  11. hb_thread_check_disk_failure 오류 문의 드립니다.

    Date2022.05.11 By큐브짱 Views187
    Read More
  12. c# cubrid -> mssql BLOB type 데이타 전환

    Date2022.05.09 By알고싶다! Views216
    Read More
  13. 큐브리드 SYSDATETIME 문의 드립니다.

    Date2022.05.06 By큐브리드궁금 Views97
    Read More
  14. [Cubrid HA] restoreslave 사용할 경우 Master/Slave 경로를 반드시 동일하게 맞춰야하나요?

    Date2022.05.06 By큐브짱 Views71
    Read More
  15. Error Number: -17 Internal error: fetching deallocated pageid 16777216 of volume 오류

    Date2022.05.04 By나라디 Views574
    Read More
  16. nodejs와 cubrid 서버와 연동 (localhost 아닙니다)

    Date2022.05.02 ByhiDev Views144
    Read More
  17. Cubrid HA 구성서버 중, Slave에서 restoreslave 동작시 오류 관련하여 문의드립니다.

    Date2022.05.02 By큐브짱 Views133
    Read More
  18. cubrid acl reload 에러

    Date2022.04.29 ByhiDev Views63
    Read More
  19. php 7.4 접속 에러

    Date2022.04.27 Byjslee Views171
    Read More
  20. php cubrid_driver 설치 에러

    Date2022.04.23 Byjslee Views299
    Read More
  21. 당혹스럽습니다. 쿼리문으로 만들어진 테이블이 있는데 삭제도 안됩니다.

    Date2022.04.21 By눈물색 Views423
    Read More
Board Pagination Prev 1 ... 14 15 16 17 18 19 20 21 22 23 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales