Background Image

FORUM

조회 수 14332 추천 수 0 댓글 10
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
OS
CentOS 6.4 x64
CUBRID Ver.
8.4.3
CUBRID TOOL Ver.

응용 환경(API)
php

* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------



HA 적용을 위해 테스트 중입니다.


Active : 1대

Stand-by : 1대 (sync)

Replica : 4대


총 6대 구성입니다.


기본 설정은 다 되있고 동기화 테스트 중인데,


]#  csql -u dba  db@127.0.0.1  -c "insert into testha values (25)"


메뉴얼에 나와있는 이 간단한 쿼리 결과의 동기화 시간이 들죽 날죽 합니다.


전체 서버에 모두 동기화 되는 시간이

짧으면 3초 내외,

길면 1분 30초 정도 걸리네요. (테스트를 반복할수록 시간이 늘어나는 경우가 발생하네요.)


보통  Replica 에 먼저 반영이 되고 그 후에 Stand-by 서버에 반영이 됩니다.

6개 서버 모두 cubrid 외 아무것도 설치 되지 않은 단독 서버들입니다.


사용자가 아무도 없는 서버에서 간단한 쿼리 조차 이렇게 오래 걸리는데,

사용자가 많아지고 쿼리가 복잡해지면 더욱 시간이 오래 걸릴 것은 당연하지 않을까 해서

실 서비스에 적용해도 될지 심히 걱정스럽습니다.


1. 동기화 속도가 이렇게 느리게 나오는 것이 정상인가요?

2. 아니라면 어느 부분을 손 봐야 할까요?

3. 9.1.0에서는 "HA 복제 반영 성능이 대폭 향상되었습니다." 라고 나오는데 어느 정도나 빨라졌을까요?


  • ?
    CUBRID_DEV 2013.04.18 01:37

    1. 매우 비정상적입니다. 여태까지 제보받지 못한 문제여서 저희도 연구 중입니다.

    2. 연구해보고 추후 댓글을 다시 달겠습니다.

    3. 응용 환경에 따라 다르겠지만 QA report 를 보면 9.1에서 상당히 많이 빨라졌습니다. NHN내에서 운영되는 CUBRID DB들은 거의 모두 HA 구성되어 운영 중이며, 거의 모두 4.x버전임에도 불구하고 큰 성능 문제는 없었습니다. 

  • ?
    reerror 2013.04.18 02:05

    비정상이라니 다행이군요.


    연구에 필요한 HA 설정파일이나 서버 환경 정보 말씀하시면 올려드리겠습니다.

  • ?
    CUBRID_DEV 2013.04.18 02:07

    위에 말씀드린대로 단건 INSERT에서 저런 지연이 있다는 것은 매우 비정상적인 상황입니다.

     

    * CUBRID HA 의 특성 상, 복제 로그 반영이 지연되고 있다고 하면 두 가지로 압축하여 원인을 파악해 볼 수 있습니다.


    A) 로그 복사가 느리다

    - replica 의 개수가 많은 경우, 약간의 저하는 있겠으나 일반적인 경우 병렬로 로그를 복사하기 때문에 크게 영향이 있기는 힘듭니다.

    - CUBRID HA 는 TCP/IP 프로토콜을 이용하여 원격 노드의 트랜잭션 로그를 복사하게 되므로, TCP/IP 관련된 네트워크 구성이나 성능에 영향을 받게 되며, 경험 상 아래의 이유로 로그 복사가 지연된 적이 있습니다.

    . 단순하게 네트워크 latency 가 큰 경우

    . 네트워크 구성 오류. A node --> B node 의 routing 테이블은 정상. B node --> A node routing 테이블 구성 오류. IP가 잘못 routing 되면서 패킷이 유실되어 재 전송이 빈번한 경우.

      이를 확인해보기 위해서는 각 호스트간 IP 네트워크 경로(tracert)가 정상인지/의도한대로 구성된 것인지를 확인해봐야 합니다.

     

    B) 복사한 로그를 반영하는 것이 느리다.

    - 이미 복사된 복제 로그를 반영하는데 지연이 발생하는 이유 역시 요약하면 다음 중 하나의 이유로 볼 수 있습니다.

    . 장비의 스펙

    . DB 서버 프로세스의 설정/능력

    ㄴ 복제 역시, 트랜잭션 로그를 서버로 다시 반영하는 형태이기 때문에, 서버의 설정이 성능에 불리하게 되어 있다면, 복제 역시 지연되어 처리됩니다.

    ㄴ 이를 위해서는 혹시 5대 장비 스펙이 유사한지, conf 파일들이 모두 동일한지를 검토해볼 필요가 있습니다.

     


    * 만일 위 내용을 확인해보시고 재시도 부탁 드리겠습니다. 답변 달아주세요~

     

  • ?
    reerror 2013.04.18 02:21

    확인 해보겠습니다.


    그전에,

    혹시 방화벽(iptables)에 의한 문제가 아닐까 싶어 6대 모두  iptables  종료 시키고 나서 계속 insert 테스트 중인데,

    iptables 종료 직후 부터 Replica 4번에 동기화가 안되는군요.


    iptables  종료 이후 나머지 전체적인 동기화 시간은 좀 빨라진것 같습니다.


    지금처럼 동기화가 중간에 멈춘 서버는 어떻게 처리해야 될까요?

    ha_make_slavedb.sh  실행해야 하나요?

  • ?
    reerror 2013.04.18 06:56
    Gigabit 구성이고 내부 망이라 지연 같은건 없습니다.
    traceroute 결과는 상호간 모두 1 hop으로 연결이 됩니다.
    장비도 쓸만한 장비들이고 2대는 새 제품입니다.

    네트워크나 장비 문제는 없는것 같네요.

    이런 저런 테스트를 하다가 방화벽을 끄고 해보니 매우 빠르게 동기화가 됩니다. (1초 내외)

    동기화 대상이 5대인데 (Stand-by 1, Replica 4) 
    휘리릭~ 되는군요.

    그리고 2대에만 방화벽을 켰습니다.

    나머지 3대는 순식간에 동기화가 되는데,
    방화벽 작동중인 2대는 하세월입니다.

    방화벽 키면 동기화가 않되는게 아니라 되기는 됩니다. 느려서 그렇지..

    그런데,
    방화벽이 문제라면 tcp 연결이 안될테니 아예 동기화가 안되야 하지 않나요?

    아래 iptables 설정 상태를 봐주십시요.

    아래는 Cubrid 사용에 필요한 포트로 알고 있습니다.
    1523:tcp
    8001:tcp
    8002:tcp
    30000:tcp
    33000:tcp
    59901:udp

    위 포트가 적용된 iptables 설정입니다.

    ]#  iptables  -L
    Chain INPUT (policy ACCEPT)
    target     prot opt source               destination
    ACCEPT     all  --  anywhere             anywhere            state RELATED,ESTABLISHED
    ACCEPT     icmp --  anywhere             anywhere
    ACCEPT     all  --  anywhere             anywhere
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:ssh
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:http
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:ftp
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:https
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpts:8001:8002
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:30000
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:33000
    ACCEPT     udp  --  anywhere             anywhere            state NEW udp dpt:59901
    ACCEPT     tcp  --  anywhere             anywhere            state NEW tcp dpt:1523
    REJECT     all  --  anywhere             anywhere            reject-with icmp-host-prohibited

    Chain FORWARD (policy ACCEPT)
    target     prot opt source               destination
    REJECT     all  --  anywhere             anywhere            reject-with icmp-host-prohibited

    Chain OUTPUT (policy ACCEPT)
    target     prot opt source               destination
    ]#  
  • ?
    CUBRID_DEV 2013.04.18 21:46

    저도 네트워크는 잘 몰라서 도움이 될련지 잘 모르겠습니다만, 방화벽 설정이 원인인 것 같네요.


    * 방화벽을 켰다는게 어떤 설정인지, 그외 설정은 없는지 등등을 확인해봐야 할 것 같습니다. 

    http://stackoverflow.com/questions/614795/simulate-delayed-and-dropped-packets-on-linux  이글을 참고해보면, 아마도 시험이나 보안 등을 이유로.. 의도적으로 패킷을 버려서 지연을 만드는 설정이 가능하니까.. 이런 설정들이 있는지 확인이 필요해보여요. 



  • ?
    reerror 2013.04.18 23:03

    위 iptables 설정은 OS 설치 직후 해당 포트만 오픈하는 아주 단순한(보편적인) 설정입니다.


    제가 테스트 하는 5대 서버 모두에서 똑같은 문제가 나왔는데,

    그렇다면 저와 같은 환경(CentOS 6.4 x64 + Cubrid 8.4.3 HA)에서 똑같은 문제가 나올 가능성이 매우 높겠죠.


    단지 방화벽 작동시 문제가 있다는것만 갖고 방화벽 설정이 원인이라고 단정 지으면 아무런 해결 방법이 안나옵니다.

    제가 보기엔 방화벽 설정은 정상인것 같거든요.


    혹시 Cubrid에 다른 원인이 있을수 있지 않을까요?


    질문입니다.

    1. 위에 적어드린 Cubrid 포트가 전부인가요?

    2. CentOS 6.4 x64 + Cubrid 8.4.3 HA 환경에 적용된 iptables 설정을 얻을수 있을까요?

  • ?
    CUBRID_DEV 2013.04.19 01:50

    흠..

    매뉴얼/릴리스노트를 뒤져보니 ( http://www.cubrid.org/ko_manual43/entry/접속%20관련%20파라미터 )

     

    특히, ECHO(7) 포트가 방화벽(firewall) 설정으로 막혀있으면 서버 프로세스 또는 클라이언트 프로세스가 각각 서로의 상태를 확인할 때 상대방 프로세스가 종료된 것으로 오인한다~~ 는 내용이 있네요. 해당 파라미터에 의해 클라이언트가 keepalive한지 판단하기 위하여 ECHO(7) 포트에 주기적으로 접속하는데, 혹시 현재 방화벽 설정에서 이게 막혀 있어서 그런게 아닌지 추측해봅니다. ECHO(7) tcp 포트 열고 확인 부탁 드립니다.

     

  • ?
    reerror 2013.04.19 05:22

    적어주신 관련 내용은 아래 링크에 나와있습니다.

    http://www.cubrid.com/zbxe/bbs_developer_tutorial/560452


    하지만 제 경우와는 해당 없습니다.

    iptables 설정 보시면 해당 포트 차단된 설정이 없습니다.


    강제로 7번 포트 열고 해보면 오히려 오작동이 되는군요.


    질문 다시 적겠습니다.

    1. 위에 적어드린 Cubrid 포트가 전부인가요?

    2. CentOS 6.4 x64 + Cubrid 8.4.3 HA 환경에 적용된 iptables 설정을 얻을수 있을까요?

    3. 혹시 회사 내에 이 문제와 관련해서 답변 주실만한 분은 또 안계신가요?


  • ?
    brightest 2013.10.17 21:21

    잘은 모르지만, iptables 설정을 어떻게 하느냐에 따라 성능에 영향이 있는 것 같습니다.

    "iptables 성능"으로 구글링한 후 검색한 결과 중 아래 2건이 관련이 있지 않을까 싶어 링크해봅니다.


    http://blog.syszone.co.kr/56

    http://coffeenix.net/bbs/viewtopic.php?p=2011&sid=0bed574f1915b4429418408707cb817b


List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 2225
1467 CUBRID Exception에 대해서 1 해킹 2013.04.26 14045
1466 큐브리드 ORDER BY ? 1 신데렐라 2013.04.24 9539
1465 밑에 있는 HA 동기화 속도 관련 질문 글은 해결 못하고 조용히 넘어가는 건가요? 5 reerror 2013.04.23 7296
1464 윈도우 -> 리눅스 큐브리드 원격접속 문제 1 박대서 2013.04.21 12137
1463 외부에서 CUBRID접근 시 포트 포워딩 방법 2 하루야 2013.04.19 13369
1462 데이터 insert 시 DB 멈추는 현상 1 file 하루야 2013.04.18 12334
1461 큐브리드 쿼리 문법 1 신데렐라 2013.04.18 10549
1460 glibc detected : cub_admin: double free or corruption (fasttop): 0x00000000020b8f60 2 reerror 2013.04.18 12629
» iptables 작동중일때 HA 동기화 속도가 너무 느립니다. 10 reerror 2013.04.18 14332
1458 Cubird 9.1 버전 single_byte_compare 속성 1 하루야 2013.04.17 9986
1457 Cannot communicate with the broker 오류 2 미스터투 2013.04.16 16196
1456 loaddb 에러 : ERROR CODE = -205 2 reerror 2013.04.16 11505
1455 한글 깨짐 문제 2 지산 2013.04.16 16004
1454 CUBRID 교육 과정 및 일정 1 OASIS 2013.04.15 7338
1453 전송 연결 현재 연결은 원격 호스트에 의해 강제로 끊겼습니다 1 바람바람 2013.04.12 20559
1452 Cubrid 점검 항목은 어떤것이 있나요 1 june2 2013.04.11 9034
1451 데이터베이스 이전 관련....질문 드립니다... 1 광황제 2013.04.11 7186
1450 실행시 오류 2 secret 반갑습니다 2013.04.10 7
1449 큐브리드 매니저 서버 연결이 종료되었다고 나옵니다. 1 file b13 2013.04.09 8354
1448 큐브리드 연동 소스 질문입니다. 1 b13 2013.04.09 8669
Board Pagination Prev 1 ... 108 109 110 111 112 113 114 115 116 117 ... 186 Next
/ 186

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2147 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales