Background Image
조회 수 1808 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부

CUBRID 2008 R4.0 버전 이상부터는 커버링 인덱스를 지원합니다, 커버링 인덱스는 “A covering index is a special case where the index itself contains the required data field(s) and can return the data.”라고 하는데 원문을 해석하면 커버링 인덱스는 인덱스 자체에 필수 데이터 필드가 들어 있고 데이터를 반환할 수 있는 특별한 인덱스라고 해석됩니다, 다시 정리하면 하나의 질의 내에 특정 인덱스를 구성하는 컬럼만 사용하는 경우 커버링 인덱스를 사용하게 됩니다

 

아래 예제-1)에서 SELECT 질의의 WHERE 조건에 사용된 컬럼 i, SELECT 리스트로 주어진 컬럼 j는 모두 인덱스 idx를 구성하는 컬럼입니다. 이와 같은 경우에 CUBRID SELECT 질의를 수행할 때 커버링 인덱스를 스캔 하게 됩니다, 이는 하나의 인덱스가 SELECT 문이 요구하는 조건과 결과를 모두 포함하고 있기 때문에 가능한 일입니다.

예제-1)

CREATE TABLE tbl (i INT, j INT);

CREATE INDEX idx ON tbl(i, j);

SELECT j FROM tbl WHERE i > 0;

 
그렇다면 왜 커버링 인덱스라는 개념이 필요할까?, 우선 설명에 앞서 우선 CUBRID의 인덱스 구조에 대해 간단하게 설명하겠습니다.

 

CUBRID B+Tree를 이용하여 인덱스를 구현하고 있습니다, B+Tree는 다음 그림과 같이 루트 노드, leaf 노드, non-leaf 노드로 구성되는데 leaf 노드에는 데이터 행(row)의 위치(OID, Object Identifier)가 저장되고 데이터는 힙(heap) 파일 내에 저장이 되며 데이터의 저장 순서는 인덱스의 순서와 관련이 없습니다.

index-heap.PNG

 

위에서 언급한대로 CUBRID의 인덱스 구조에서는 데이터가 인덱스 외부에 위치하며 데이터의 저장 순서는 인덱스 구성에 영향을 주지 않습니다, 이와 같은 형태의 인덱스를 non-clustered 인덱스라고 부릅니다. 이 구조에서는 인덱스가 데이터의 위치만 가지고 있기 때문에 인덱스 탐색 중에 데이터를 읽어와야 하고 그로 인해 디스크 Random access I/O가 추가로 발생할 수 있습니다.

 

 

그런데, 만약 이 때 사용되는 인덱스 내에서 SELECT 질의에 대한 결과를 모두 얻을 수 있는 상황이라면 힙 파일에 저장되어 있는 데이터를 읽어오지 않아도 인덱스 키의 값으로 결과를 만들어 낼 수 있을 것입니다, 이와 같이 인덱스가 하나의 질의를 모두커버한 경우에 대해서커버링 인덱스라고 말합니다.

 

커버링 인덱스는 I/O양을 줄일 수 있는 방법으로 알려져 있습니다, 힙 파일에서 데이터를 읽어오지 않음으로 인해 줄어드는 I/O 외에도, 일반적으로 인덱스 키가 데이터 행 전체의 크기보다 훨씬 작다는 점, 질의 처리에 인덱스를 자주 사용하게 되면 인덱스가 CUBRID 메모리 버퍼에 캐싱(caching)되어 있을 가능성이 높은 점이 I/O를 줄이는 역할을 합니다. 또한 인덱스는 값에 따라 정렬되어 있기 때문에 순차적(sequential) 접근이 가능하므로 데이터를 읽기 위해 힙 파일을 랜덤(random)하게 접근하는 것에 비해 I/O 비용이 적게 드는 장점도 생각해 볼 수 있습니다.

 

 

앞서 설명한 것과 같이, 커버링 인덱스는 많은 양의 I/O를 줄일 수 있고 SELECT 질의의 성능을 향상시킬 수 있습니다. 하지만 커버링 인덱스를 사용하기 위해 무작정 인덱스 컬럼을 늘이거나 인덱스를 추가로 생성하게 되면 그에 따른 인덱스 관리 비용이 증가하고 입력/갱신 비용이 증가할 수 있습니다, 따라서 커버링 인덱스 사용 여부를 결정할 때에는 질의의 성능, I/O 비용, 저장 공간에 대한 비용 등을 전체적으로 고려해야 합니다, 일반적으로 데이터 행 전체의 크기에 비해 인덱스 키의 크기가 작고 커버링 인덱스를 이용하는 질의가 자주 수행되는 것이 확실하다면 커버링 인덱스를 사용하는 편이 합리적입니다.

 

 

CUBRID에서 커버링 인덱스가 사용되는 것을 확인하기 위해서는 질의 실행 계획(plan)을 확인하면 됩니다, 앞서 예를 든 질의의 쿼리를 살펴보면 예제-2)와 같이 “covers”라는 단어를 확인할 수 있습니다, 인덱스 스캔 계획에서 “covers”라는 단어가 보이면 커버링 인덱스가 사용된 것입니다.

 

예제-2)

Query plan

iscan

class: tbl node[0]

index: idx term[0] (covers)

cost:  fixed 0(0.0/0.0) var 1(0.0/1.0) card 0

 

Query plan 통계 정보 확인 방법은 CUBRID 온라인 매뉴얼을 참고해주시기 바랍니다. (https://www.cubrid.org/manual/ko/9.3.0/sql/tuning.html)

 


  1. CUBRID vs. Oracle 총소유비용(TCO) 비교

    작년 말 CIO BIZ+ 기사를 통해 오라클이 서버용 SW 라이선스 정책을 수정했다는 내용을 확인하게 되었습니다.   내년부터 HP서버용 오라클 SW 가격 ‘2배’...썬은 50%↓   기사 내용의 요지는 스팍 프로세서의 라이선스 팩터(코어에 대한 라이선스 가중치)를 0.75에서 0.5로 내리고, HP 아이테니엄 프로세서(팩터 0.5)와 IBM 파워 프로세서(팩터 0.75)에 대한 팩터는 1로 조정을 함으로써 HP/IBM 서버 기반으로 Oracle DBMS를 구축할 경우 라이선스 비용이 증가하게 되었다는 것입니다(Oracle for HP는 100%, Oracle for IBM은 33% 가격 인상 효과). 반대로 SUN 서버 + Oracle 조합으로 구매하는 사용자는 DBMS 라이선스에 대한 비용을 절감할 수 있고요.   IBM이야 자체적으로 DBMS 제품(DB2)을 보유하고 있기 때문에 상대적으로 영향을 덜 받겠지만, HP는 상황이 달라지는 것 같습니다. 최근 코리아크레딧뷰로(KCB)가 유닉스 서버 가상화 및 통합 사업을 진행하면서 기존 HP 서버를 IBM 서버로 전면 교체하기로 결정을 했다고 합니다(관련 기사: HP 유닉스서버, 오라클 가격인상 직격탄 맞다). 반면 MS와의 협력을 강화하여 어플라이언스 4종을 발표하는 행보를 보이고 있고요(...
    Date2011.01.29 Category라이선스 고찰 By정병주 Views44626 Votes0
    Read More
  2. CUBRID 서비스 계약에 대한 이해 – 독립 소프트웨어 벤더(ISV)

    지난 달에 최종사용자(End-user)를 위한 CUBRID 서비스 계약에 대해 간략하게 살펴보았습니다. 금번에는 독립 소프트웨어 벤더(ISV: Independent Software Vendor)들이 CUBRID 기반으로 응용 소프트웨어(애플리케이션)를 개발/포팅하여 판매하는 경우에 대해서 설명을 드리도록 하겠습니다.   우선, CUBRID는 오픈소스 DBMS이고, DBMS 엔진은 GPL v2 or higher, 인터페이스는 “BSD 라이선스”를 적용하고 있다는 것은 잘 알고 계실 것입니다. 여기서 인터페이스 함은 JDBC, PHP, ODBC, OLEDB, CCI (C Client Interface) 등을 의미하며, 일반적으로 DBMS 기반의 애플리케이션을 개발할 때 주로 사용합니다. 따라서, CUBRID는 ISV들이 애플리케이션 개발/포팅을 완료한 후 최종사용자를 대상으로 비즈니스를 전개할 때 애플리케이션 소스코드를 공개할 필요가 없으며, 이와 관련된 상세한 내용은 “차별화된 라이선스 정책, 큐브리드 OSS 라이선스 가이드”를 참고하시기 바랍니다.      첫번째 모델은 ISV가 큐브리드사 기술지원 서비스 계약 없이 자체적으로 애플리케이션을 개발하여 판매하는 방식입니다. 주로 소규모의 애플리케이션에 적합하며, 최종사용자에 대한 CUBRID 기술...
    Date2010.11.16 Category라이선스 고찰 By정병주 Views33504 Votes0
    Read More
  3. CUBRID 서비스 계약에 대한 이해 – 최종사용자

    CUBRID는 오픈소스 라이선스를 채택하고 있습니다. DBMS 엔진은 GPL v2 or higher, 인터페이스는 BSD 라이선스를 적용하고 있으며, 소프트웨어 사용에 아무런 제약조건이 없습니다. 따라서 상용 소프트웨어와 같이 소프트웨어 라이선스(사용권)를 얻기 위해 비용을 지불할 필요가 없습니다. (참고: CUBRID 라이선스 및 서비스 정책에 대한 고찰)     CUBRID는 별도의 라이선스 비용 없이 서비스 비용만 지불하면 되며, 고객들을 만날 때 자주 질문 받는 내용 중 하나인 서비스 정책과 계약 방법에 대해 살펴 보도록 하겠습니다.   CUBRID의 서비스 정책은 크게 프로페셔널 서비스와 서포트 서비스로 나뉘어집니다.      프로페셔널 서비스는 개발 단계에서 제공되는 서비스로서 DB 설계 지원, 스키마 리뷰, 질의 리뷰, 데이터 변환 및 성능 튜닝 서비스 등이 포함되어 있습니다. 비용은 시간당 9만원(VAT 별도)이며, 지원 받고자 하는 시간만큼 계약을 체결하고 서비스를 제공 받으시면 됩니다.   응용 개발이 끝나면 일반적으로 운영 단계로 넘어갑니다. 운영 단계에서는 정기적인 예방점검(PM: Preventive Maintenance)을 통해 문제 발생을 선제적으로 방지하고, 각종 온라인...
    Date2010.10.12 Category라이선스 고찰 By정병주 Views36012 Votes0
    Read More
  4. CUBRID 라이선스 및 서비스 정책에 대한 고찰

    작년 11월 CUBRID가 오픈소스 DBMS로 전환하면서 라이선스 정책도 새롭게 발표되었습니다. DBMS 엔진은 GPL v2, 인터페이스는 BSD 라이선스. 엔진과 인터페이스를 구분하여 서로 다른 라이선스를 채택하였는데, 자세한 내용은 ‘차별화된 라이선스 정책, 큐브리드 OSS 라이선스 가이드’를 참고하시기 바랍니다. CUBRID가 라이선스 정책을 구분하여 적용한 배경이 궁금해지실 텐데요, 우선 GPL 라이선스는 소스 코드의 수정 및 배포가 자유로운 반면, 2차 저작물에 대한 재공개 의무가 있습니다. 즉, 수정된 소스 코드는 GPL 라이선스 하에 모두 공개되어 다른 개발자와 사용자들에게 공유되어야 하며, CUBRID가 엔진 소스 코드에 대한 라이선스를 GPL로 결정한 것도 동일한 컨텍스트(context)에서 이해해 주시면 될 것 같습니다. 반면, CUBRID 인터페이스는 BSD 라이선스를 채택하였는데, BSD 라이선스는 2차 저작물에 대한 재공개 의무가 없고, 독점 소프트웨어와의 결합이 가능합니다. 따라서, DBMS 기반의 응용 개발자나 독립소프트웨어벤더(ISV) 입장에서 자신 혹은 자사가 개발한 애플리케이션의 소스 코드를 공개하고 싶지 않은 경우에도 사용 상 특별한 제약...
    Date2009.05.27 Category라이선스 고찰 By정병주 Views51377 Votes0
    Read More
Board Pagination Prev 1 Next
/ 1

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales