Background Image
조회 수 1815 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부

CUBRID 2008 R4.0 버전 이상부터는 커버링 인덱스를 지원합니다, 커버링 인덱스는 “A covering index is a special case where the index itself contains the required data field(s) and can return the data.”라고 하는데 원문을 해석하면 커버링 인덱스는 인덱스 자체에 필수 데이터 필드가 들어 있고 데이터를 반환할 수 있는 특별한 인덱스라고 해석됩니다, 다시 정리하면 하나의 질의 내에 특정 인덱스를 구성하는 컬럼만 사용하는 경우 커버링 인덱스를 사용하게 됩니다

 

아래 예제-1)에서 SELECT 질의의 WHERE 조건에 사용된 컬럼 i, SELECT 리스트로 주어진 컬럼 j는 모두 인덱스 idx를 구성하는 컬럼입니다. 이와 같은 경우에 CUBRID SELECT 질의를 수행할 때 커버링 인덱스를 스캔 하게 됩니다, 이는 하나의 인덱스가 SELECT 문이 요구하는 조건과 결과를 모두 포함하고 있기 때문에 가능한 일입니다.

예제-1)

CREATE TABLE tbl (i INT, j INT);

CREATE INDEX idx ON tbl(i, j);

SELECT j FROM tbl WHERE i > 0;

 
그렇다면 왜 커버링 인덱스라는 개념이 필요할까?, 우선 설명에 앞서 우선 CUBRID의 인덱스 구조에 대해 간단하게 설명하겠습니다.

 

CUBRID B+Tree를 이용하여 인덱스를 구현하고 있습니다, B+Tree는 다음 그림과 같이 루트 노드, leaf 노드, non-leaf 노드로 구성되는데 leaf 노드에는 데이터 행(row)의 위치(OID, Object Identifier)가 저장되고 데이터는 힙(heap) 파일 내에 저장이 되며 데이터의 저장 순서는 인덱스의 순서와 관련이 없습니다.

index-heap.PNG

 

위에서 언급한대로 CUBRID의 인덱스 구조에서는 데이터가 인덱스 외부에 위치하며 데이터의 저장 순서는 인덱스 구성에 영향을 주지 않습니다, 이와 같은 형태의 인덱스를 non-clustered 인덱스라고 부릅니다. 이 구조에서는 인덱스가 데이터의 위치만 가지고 있기 때문에 인덱스 탐색 중에 데이터를 읽어와야 하고 그로 인해 디스크 Random access I/O가 추가로 발생할 수 있습니다.

 

 

그런데, 만약 이 때 사용되는 인덱스 내에서 SELECT 질의에 대한 결과를 모두 얻을 수 있는 상황이라면 힙 파일에 저장되어 있는 데이터를 읽어오지 않아도 인덱스 키의 값으로 결과를 만들어 낼 수 있을 것입니다, 이와 같이 인덱스가 하나의 질의를 모두커버한 경우에 대해서커버링 인덱스라고 말합니다.

 

커버링 인덱스는 I/O양을 줄일 수 있는 방법으로 알려져 있습니다, 힙 파일에서 데이터를 읽어오지 않음으로 인해 줄어드는 I/O 외에도, 일반적으로 인덱스 키가 데이터 행 전체의 크기보다 훨씬 작다는 점, 질의 처리에 인덱스를 자주 사용하게 되면 인덱스가 CUBRID 메모리 버퍼에 캐싱(caching)되어 있을 가능성이 높은 점이 I/O를 줄이는 역할을 합니다. 또한 인덱스는 값에 따라 정렬되어 있기 때문에 순차적(sequential) 접근이 가능하므로 데이터를 읽기 위해 힙 파일을 랜덤(random)하게 접근하는 것에 비해 I/O 비용이 적게 드는 장점도 생각해 볼 수 있습니다.

 

 

앞서 설명한 것과 같이, 커버링 인덱스는 많은 양의 I/O를 줄일 수 있고 SELECT 질의의 성능을 향상시킬 수 있습니다. 하지만 커버링 인덱스를 사용하기 위해 무작정 인덱스 컬럼을 늘이거나 인덱스를 추가로 생성하게 되면 그에 따른 인덱스 관리 비용이 증가하고 입력/갱신 비용이 증가할 수 있습니다, 따라서 커버링 인덱스 사용 여부를 결정할 때에는 질의의 성능, I/O 비용, 저장 공간에 대한 비용 등을 전체적으로 고려해야 합니다, 일반적으로 데이터 행 전체의 크기에 비해 인덱스 키의 크기가 작고 커버링 인덱스를 이용하는 질의가 자주 수행되는 것이 확실하다면 커버링 인덱스를 사용하는 편이 합리적입니다.

 

 

CUBRID에서 커버링 인덱스가 사용되는 것을 확인하기 위해서는 질의 실행 계획(plan)을 확인하면 됩니다, 앞서 예를 든 질의의 쿼리를 살펴보면 예제-2)와 같이 “covers”라는 단어를 확인할 수 있습니다, 인덱스 스캔 계획에서 “covers”라는 단어가 보이면 커버링 인덱스가 사용된 것입니다.

 

예제-2)

Query plan

iscan

class: tbl node[0]

index: idx term[0] (covers)

cost:  fixed 0(0.0/0.0) var 1(0.0/1.0) card 0

 

Query plan 통계 정보 확인 방법은 CUBRID 온라인 매뉴얼을 참고해주시기 바랍니다. (https://www.cubrid.org/manual/ko/9.3.0/sql/tuning.html)

 


  1. 국가정보자원관리원 G-클라우드

    G-클라우드 추진 배경 대한민국 전자정부의 심장 역할을 수행하는 국가정보자원관리원(구, 정부통합전산센터)는 47개 중앙행정기관의 IT 인프라를 위탁 운영하는 행정안전부 산하기관으로 약 22,000개 SW와 24,000개 HW 정보자원의 효율적 운용을 통해 24시간 365일 중단 없는 행정 서비스를 제공하고 있으며, 제1센터(대전)와 제2센터(광주)에 각 기관의 업무시스템이 입주하고 있습니다. 국가정보자원관리원에서는 새로운 IT 서비스 패러다임으로 클라우드 컴퓨팅이 부각 되면서 정보자원의 효율적 도입 및 구축을 통한 비용절감과 대국민 서비스 향상의 동시 실현이 가능한 정부 클라우드컴퓨팅 센터 구현을 추진하고 있으며, 2017년까지 1) 전자정부 업무의 클라우드 환경 60% 전환, 2) 공개 소프트웨어 50% 도입, 3) IT 운영 예산 40% 절감이라는 세부적인 목표 하에 G-클라우드 구축사업을 단계적으로 추진해 오고 있습니다. G-클라우드 추진 현황 2011년부터 대전센터를 중심으로 G-클라우드 시범 인프라를 구축하기 시작하였으며, 클라우드 풀(Pool) 구축을 위한 x86 범용 서버와 Linux/Windows 가상화 솔루션, 공개SW 기반의 OS, DBMS, WEB/WAS를 도입하였습니다. 그...
    Date2017.09.19 Category고객 적용사례 By정병주 Views5996 Votes0
    Read More
  2. NHN은 CUBRID를 얼마만큼 사용하고 있을까?

    지난 주 목요일 전자신문 정보통신면(7면) 좌상단에 “NHN, DBMS 국산 ‘큐브리드’로”라는 제목으로 기사가 크게 게재되었습니다(관련 기사 참조). 국내 최대 규모의 데이터베이스를 보유하고 있는 NHN이 네이버 서비스와 사내 인프라에 적용되는 데이터베이스관리시스템(DBMS)을 모두 CUBRID로 교체한다는 내용으로 as-is와 to-be에 대해서 기술되어 있습니다. 기사 내용을 정리해 보면 아래와 같습니다.   As-is       - NHN은 3년 전부터 CUBRID DBMS를 적용하기 시작 -> 오픈소스 DBMS로 전환하기 전인 CUBRID 7.x 버전부터 사용     - 현재 네이버에서 제공하는 80여개의 서비스에 적용했음(NHN 전체 서비스의 30% 수준)     - DB 서버 수 기준으로 NHN 전체 서버 중 5~6%에 해당     - 적용 분야도 카페 덧글, 블로그 덧글 등 대용량 서비스를 포함한 핵심 분야   To-be       - DB 서버 수 기준으로 2011년 말까지 NHN 전체 서버의 약 30%에 CUBRID가 적용될 전망     - CUBRID DBMS 적용 서비스를 지속적으로 확대해 향후 2~3년 안에 가능한 모든 DBMS를 CUBRID로 전환할 계획   2008년 11월 CUBRID가 오픈소스 DBMS로 전환되고 2년 3개월이 조금 넘은 시점인데 NHN의 주...
    Date2011.03.15 Category고객 적용사례 By정병주 Views30174 Votes0
    Read More
Board Pagination Prev 1 Next
/ 1

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales