Background Image

FORUM

조회 수 189 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄


* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.

OS
Redhat 7.6 Enterprise
CUBRID Ver.
10.1.5.7809
CUBRID TOOL Ver.
10.2.0.0001
응용 환경(API)
JAVA


* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.

 

에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
 

안녕하세요. 현재 가상화 서버 2대를 HA 구성하여 운영중에 있습니다.

현재 새벽마다 hb_thread_check_disk_failure 오류가 발생하고 있습니다.

ha_ping_hosts 옵션은 추가되어있는 상태입니다.

 

원인이 어떤것인지, 어떻게 해결해야할지 잘 모르겠어서 문의드립니다.

 

시스템 로그(/var/log/messages)에서 확인된 오류는 아래와 같습니다.

#DB01 Master 서버

May 10 01:02:39

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 10 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffff9b2831fb4200        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff918d2ba0>] ? task_rq_unlock+0x20/0x20

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

 

#DB02 Slave 서버

May 10 01:05:31

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

 

-------- 다음날 새벽 --------

 

#DB01 Master 서버

May 11 01:03:09

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 11 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

May 11 01:08:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

#DB02 Slave 서버

오류 로그 없음.

 

  • ?
    오명환 2022.05.11 13:51
    올려주신 메세지를 보면 사용하는 시스템에서 해당 시간대에 fsync 수행시 file system이 block되는 현상이 발생하는 것 같습니다.
    $CUBRID/conf/cubrid.conf의 설정값 중 ha_check_disk_failure_interval의 기본값은 15초입니다.
    즉, 15초동안 disk 관련 행위에 응답이 없으면, timeout이 발생하여 fail-over가 발생합니다.

    우선적으로 해당 시간대에 어떤 행위에 의해 file system이 block되는지 원인을 파악해보세요.
    차선잭으로는 cubrid.conf의 ha_check_disk_failure_interval 의 값을 늘려보세요. (설정값을 적용하려면 restart 하셔야 합니다.)

List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 CUBRID 사용자를 위한 DBeaver 도구 출시 안내 admin 2024.04.23 122
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 4476
3922 프로세스 점유에 대해 질문 드립니다. 1 file 이석희 2009.02.24 13458
3921 프로그램 개발 후 배포 관련 3 늘푸른거북이 2009.02.12 25365
3920 풀스캔 1 벌래잡이 2016.11.18 13756
3919 표준프레임워크의 공통컴포넌트에 게시판설치관련 3 file 큐브리 2012.08.31 22768
3918 표준SQL 지원 관련 문의 1 뒷태지존 2013.06.25 7933
3917 포트에 대해 질문이 있습니다. 1 쿨랑 2011.01.11 7790
3916 포트 및 설정 관련 재 질문 드립니다. 1 푸추어핸접 2013.10.29 8374
3915 폐쇄망에서의 큐브리드 운영문의 1 woorirk 2015.01.16 7509
3914 평창농업기술정보센터입니다. ^^ 2 secret 바보천사 2009.04.24 13
3913 페이징과 전체 카운트 쿼리 가져올 수 있도록 해주세요.ㅠㅠ 1 마산이프로 2011.10.29 30078
3912 페도라 10에서 큐브리드 rpm 설치시 오류 1 스나이퍼 2009.03.26 16391
3911 펑션 오류 문의드립니다 8 초코초코초 2022.12.17 143
3910 패키지 분화가 가능할까요? 1 ienfant 2010.01.15 9565
3909 패스워드 암호화 알고리즘 1 igloojs 2019.05.17 285
3908 파티션키 여러개의 컬럼 구성 가능 여부 1 타임 2021.09.07 212
3907 파티션 테이블에 대해서.. 1 알칸펠 2014.01.17 11067
3906 파티션 테이블 성능 문의 4 file 방글이 2024.01.11 116
3905 파티션 테이블 목록을 조회 할려고 하는데요. 1 Philip Park 2020.03.25 206
3904 파티션 테이블 대량 DROP 처리 문의 (ibatis) 1 방글이 2024.01.04 79
3903 파티셔닝으로 성능향상 미비? 1 라면 2016.08.04 13222
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 201 Next
/ 201

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales