Background Image

FORUM

조회 수 9450 추천 수 0 댓글 3
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
 CentOS 6.5 64bit
CUBRID Ver.
 CUBRID 2008 R4.3 (8.4.3.6001) (64bit release build for linux_gnu) (Aug  1 2014 10:20:56)
CUBRID TOOL Ver.

응용 환경(API)
 php 5.3.3
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------


데이터베이스를 HA 구성하여 Active, Standby 로 운영 중입니다.


구성 후 Standby 서버에서 서비스가 중단되는 현상이 발생합니다.


다음은 관련 에러로그입니다.


1. Server error log

Time: 08/30/14 23:40:41.775 - ERROR *** file ../../src/connection/server_support.c, line 698 ERROR CODE = -989 Tran = 0, CLIENT = (unknown):(unknown)(-1), EID = 1

Process event: Disconnected with the cub_master and will shut itself down. 



2. DBNAME@localhost_applylogdb_DBNAME_nodeA.err

Time: 08/30/14 23:40:41.789 - ERROR *** file ../../src/communication/network_cl.c, line 4254 ERROR CODE = -186 Tran = 2, EID = 2

Error receiving data from server.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 195 ERROR CODE = -199 Tran = 2, EID = 3

Server no longer responding.... Invalid argument


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/transaction/transaction_cl.c, line 673 ERROR CODE = -111 Tran = 2, EID = 4

Your transaction has been aborted by the system due to server failure or mode change.


Time: 08/30/14 23:40:41.790 - ERROR *** file ../../src/communication/network_cl.c, line 1072 ERROR CODE = -199 Tran = -1, EID = 5

Server no longer responding.



3. DBNAME@nodeA_copylogdb.err

Time: 08/30/14 23:40:42.766 - ERROR *** file ../../src/connection/heartbeat.c, line 271 ERROR CODE = -989 Tran = 2, EID = 2

Process event: Disconnected with the cub_master and will shut itself down. 


Time: 08/30/14 23:41:00.242 - ERROR *** file ../../src/transaction/log_writer.c, line 1353 ERROR CODE = -1037 Tran = 2, EID = 3

log writer: log writer shut itself down by signal.




4. databases.txt 설정

DBNAME         /home/CUBRID/databases/DBNAME  nodeA:nodeB     /home/CUBRID/databases/DBNAME

  file:/home/CUBRID/databases/DBNAME/lob



5. /etc/hosts 설정

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6


192.168.127.95  nodeA

192.168.127.73  nodeB



동일하게 구성한 2그룹 중 한개의 그룹만 동일 문제가 2회 이상 발생했습니다.


해당 부분의 에러코드를 분석하려 했으나 원인을 찾지 못하겠습니다.


조언 부탁드립니다.

  • ?
    정만영 2014.09.02 02:28

    안녕하세요.

    마스터와 슬레이브간에 네트워크가 불안정해서 split-brain 현상이 발생한 문제로 판단 됩니다.

    $CUBRID/conf/cubrid_ha.conf 환경설정에 ha_ping_hosts=무정지IP 등록/추가 후 HA 재구동하여 서비스를 운영해 보세요.

    파라미터를 설정하면 불안정한 네트워크로 인해 상대 마스터 노드가 비정상 종료된 것으로 오인한 슬레이브 노드가 마스터 노드로 역할이 변경되면서 동시에 두 개의 마스터 노드가 존재하게 되는 split-brain 현상을 방지할 수 있습니다.

  • ?
    freemir 2014.09.02 03:02

    안녕하세요.


    해당 슬레이브 서비스가 중지된 당시에 서비스가 내려간 것으로 보이나 일부 프로세스가 구동 중인 현상이 있었습니다.

    split-brain이 발생하면 해당 서비스도 정상적으로 내려가야 하는 것이 아닌지 궁금합니다.


    root@nodeB:~# cubrid service status

    @ cubrid master status

    ++ cubrid master is not running.

    @ cubrid server status

    ++ cubrid master is not running.

    @ cubrid broker status

      NAME           PID  PORT  AS  JQ      REQ  TPS  QPS    LONG-T    LONG-Q  ERR-Q

    ================================================================================

    * query_editor  3949 30000   5   0        0    0    0    0/60.0    0/60.0      0

    * broker1       3959 33000   5   0        0    0    0    0/60.0    0/60.0      0

    @ cubrid manager server status

    ++ cubrid manager server is running.



    root@nodeB:~# cubrid hb status

    @ cubrid heartbeat list

    ++ cubrid master is not running.



    root@nodeB:~# ps axfww | grep cub

     57942 pts/1    S+     0:00          _ grep cub

      3949 ?        Sl     2:43 cub_broker

      3950 ?        S      0:00 query_editor_cub_cas_1

      3951 ?        S      0:00 query_editor_cub_cas_2

      3952 ?        S      0:00 query_editor_cub_cas_3

      3953 ?        S      0:00 query_editor_cub_cas_4

      3954 ?        S      0:00 query_editor_cub_cas_5

      3959 ?        Sl     2:53 cub_broker

      3960 ?        S      0:00 broker1_cub_cas_1

      3961 ?        S      0:00 broker1_cub_cas_2

      3962 ?        S      0:00 broker1_cub_cas_3

      3963 ?        S      0:00 broker1_cub_cas_4

      3964 ?        S      0:00 broker1_cub_cas_5

      3972 ?        Sl     0:10 cub_auto start

      3977 ?        Sl     0:41 cub_cmserver

      4044 ?        Ss     0:00 cub_cmhttpd

      4046 ?        S      0:00  _ cub_cmhttpd

      4045 ?        S      0:00 cub_js start

      6540 ?        S      0:23 cub_admin applylogdb -L /home/CUBRID/databases/DBNAME_nodeA --max-mem-size=500 DBNAME@localhost

  • ?
    정만영 2014.09.04 19:07

    안녕하세요.

    CUBRID HA 관련 프로세서는 cub_server, copylogdb, applylogdb로 브로커, 매니저는 HA정지 시 구동되어 있는 것이 정상입니다.

    ps로 확인한 결과에서 applylogdb 프로세서가 남아 있는데 kill로 applylogdb 프로세서만을 종료하시고 cubrid heartbeat start 구동하시면 HA가 정상 구동될 것입니다.

    수고하세요.



  1. SQLGate for CUBRID 영구 무료 라이선스 제공

  2. TimeStamp 관련 Select 오류 질문입니다

  3. No Image 30Mar
    by 님장사드리브큐
    2017/03/30 by 님장사드리브큐
    Views 8245  Replies 2

    Tibero -> Cubrid 마이그레이션 질문입니다.

  4. This object is in a zombie state 인 경우

  5. This object is in a zombie state 오류발생 도와주세요 ㅠㅠ

  6. This may take a long time depending on the amount of recovery works to do.?

  7. The size of data received from server is different from the expected

  8. The column name is invalid. 에러메시지 좀...

  9. Table 및 column에 대한 description은 제공을 안하나요?

  10. Table 및 Index 가 사용하고 크기를 알수 있는 방법을 알려 주세요

  11. Table 및 Column Comment 작성

  12. Table primary key잡는 중 중단 시키고, 서버 재시작하니 에러나고 시작이 안되네요.

  13. Table doesn't exist 에러..

  14. Table Drop, truncate 시 시간이 너무 오래 걸립니다.

  15. Table Drop 후 데이터 볼륨 Size 에 변동이 없네요.

  16. TO_DATETIME 함수 문의 드립니다.

  17. TO_CHAR 관련 질문입니다.

  18. TIMEZONE 질문

  19. TIMESTAMP 형 data를 insert 하는 sql문이 궁금합니다.

  20. TIME 포맷 관련 질문 입니다.

  21. System.Data.OleDb.OleDbException (0x80004005): Cannot communicate with server 오류

Board Pagination Prev 1 ... 143 144 145 146 147 148 149 150 151 152 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales