Background Image
조회 수 1817 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부

CUBRID 2008 R4.0 버전 이상부터는 커버링 인덱스를 지원합니다, 커버링 인덱스는 “A covering index is a special case where the index itself contains the required data field(s) and can return the data.”라고 하는데 원문을 해석하면 커버링 인덱스는 인덱스 자체에 필수 데이터 필드가 들어 있고 데이터를 반환할 수 있는 특별한 인덱스라고 해석됩니다, 다시 정리하면 하나의 질의 내에 특정 인덱스를 구성하는 컬럼만 사용하는 경우 커버링 인덱스를 사용하게 됩니다

 

아래 예제-1)에서 SELECT 질의의 WHERE 조건에 사용된 컬럼 i, SELECT 리스트로 주어진 컬럼 j는 모두 인덱스 idx를 구성하는 컬럼입니다. 이와 같은 경우에 CUBRID SELECT 질의를 수행할 때 커버링 인덱스를 스캔 하게 됩니다, 이는 하나의 인덱스가 SELECT 문이 요구하는 조건과 결과를 모두 포함하고 있기 때문에 가능한 일입니다.

예제-1)

CREATE TABLE tbl (i INT, j INT);

CREATE INDEX idx ON tbl(i, j);

SELECT j FROM tbl WHERE i > 0;

 
그렇다면 왜 커버링 인덱스라는 개념이 필요할까?, 우선 설명에 앞서 우선 CUBRID의 인덱스 구조에 대해 간단하게 설명하겠습니다.

 

CUBRID B+Tree를 이용하여 인덱스를 구현하고 있습니다, B+Tree는 다음 그림과 같이 루트 노드, leaf 노드, non-leaf 노드로 구성되는데 leaf 노드에는 데이터 행(row)의 위치(OID, Object Identifier)가 저장되고 데이터는 힙(heap) 파일 내에 저장이 되며 데이터의 저장 순서는 인덱스의 순서와 관련이 없습니다.

index-heap.PNG

 

위에서 언급한대로 CUBRID의 인덱스 구조에서는 데이터가 인덱스 외부에 위치하며 데이터의 저장 순서는 인덱스 구성에 영향을 주지 않습니다, 이와 같은 형태의 인덱스를 non-clustered 인덱스라고 부릅니다. 이 구조에서는 인덱스가 데이터의 위치만 가지고 있기 때문에 인덱스 탐색 중에 데이터를 읽어와야 하고 그로 인해 디스크 Random access I/O가 추가로 발생할 수 있습니다.

 

 

그런데, 만약 이 때 사용되는 인덱스 내에서 SELECT 질의에 대한 결과를 모두 얻을 수 있는 상황이라면 힙 파일에 저장되어 있는 데이터를 읽어오지 않아도 인덱스 키의 값으로 결과를 만들어 낼 수 있을 것입니다, 이와 같이 인덱스가 하나의 질의를 모두커버한 경우에 대해서커버링 인덱스라고 말합니다.

 

커버링 인덱스는 I/O양을 줄일 수 있는 방법으로 알려져 있습니다, 힙 파일에서 데이터를 읽어오지 않음으로 인해 줄어드는 I/O 외에도, 일반적으로 인덱스 키가 데이터 행 전체의 크기보다 훨씬 작다는 점, 질의 처리에 인덱스를 자주 사용하게 되면 인덱스가 CUBRID 메모리 버퍼에 캐싱(caching)되어 있을 가능성이 높은 점이 I/O를 줄이는 역할을 합니다. 또한 인덱스는 값에 따라 정렬되어 있기 때문에 순차적(sequential) 접근이 가능하므로 데이터를 읽기 위해 힙 파일을 랜덤(random)하게 접근하는 것에 비해 I/O 비용이 적게 드는 장점도 생각해 볼 수 있습니다.

 

 

앞서 설명한 것과 같이, 커버링 인덱스는 많은 양의 I/O를 줄일 수 있고 SELECT 질의의 성능을 향상시킬 수 있습니다. 하지만 커버링 인덱스를 사용하기 위해 무작정 인덱스 컬럼을 늘이거나 인덱스를 추가로 생성하게 되면 그에 따른 인덱스 관리 비용이 증가하고 입력/갱신 비용이 증가할 수 있습니다, 따라서 커버링 인덱스 사용 여부를 결정할 때에는 질의의 성능, I/O 비용, 저장 공간에 대한 비용 등을 전체적으로 고려해야 합니다, 일반적으로 데이터 행 전체의 크기에 비해 인덱스 키의 크기가 작고 커버링 인덱스를 이용하는 질의가 자주 수행되는 것이 확실하다면 커버링 인덱스를 사용하는 편이 합리적입니다.

 

 

CUBRID에서 커버링 인덱스가 사용되는 것을 확인하기 위해서는 질의 실행 계획(plan)을 확인하면 됩니다, 앞서 예를 든 질의의 쿼리를 살펴보면 예제-2)와 같이 “covers”라는 단어를 확인할 수 있습니다, 인덱스 스캔 계획에서 “covers”라는 단어가 보이면 커버링 인덱스가 사용된 것입니다.

 

예제-2)

Query plan

iscan

class: tbl node[0]

index: idx term[0] (covers)

cost:  fixed 0(0.0/0.0) var 1(0.0/1.0) card 0

 

Query plan 통계 정보 확인 방법은 CUBRID 온라인 매뉴얼을 참고해주시기 바랍니다. (https://www.cubrid.org/manual/ko/9.3.0/sql/tuning.html)

 


  1. 공공부문 DBMS 정보자원 현황

    행정안전부/한국지능정보사회진흥원(NIA)에서는 매년 '범정부EA기반 공공부문 정보자원 현황 통계보고서'를 발간합니다. 2022년도 통계보고서는 금년 7월 초에 공개가 되었으며, 최근에 전자신문에서 통계보고서를 기반으로 한 스페셜리포트 기사(공공SW 외산 쏠림 해법은?)를 게재하였습니다. 전자신문 기사에서 공공SW 외산 쏠림 해법으로 2가지를 제시했습니다. 오픈소스 소프트웨어를 활용하여 외산 종속을 탈피하거나 공공부문 SaaS 국산화를 추진하자는 것입니다. 사실 국내 SW 산업은 정보보호, 관제 등 일부 분야를 제외하고 OS, DBMS, WEB/WAS, 백업 등 대부분의 영역에서 외산 편중이 높은 상황입니다. 이제부터 DBMS에 한정해서 조금 더 살펴보겠습니다. 아래 데이터는 2021년 기준이며, Oracle이 63.6%로 여전히 1위 자리를 지키고 있으며, 이어서 Microsoft (SQL Server), 큐브리드, 티맥스데이터(Tibero)가 순위를 차지하고 있습니다. [출처 : 2022년도 범정부EA기반 공공부문 정보자원 현황 통계보고서, 55쪽] 비록 Oracle와 Microsoft의 수량 점유율이 약 80%로 쏠림 현상이 강하게 나타나고 있으나, 큐브리드와 티맥스데이터의 수량을 합치면 15%가 ...
    Date2022.10.21 Category시장 살펴보기 By정병주 Views568 Votes0
    Read More
  2. Oracle Database SE2 살펴보기

    오라클의 FY 2016 3사분기 시작일인 2015년 12월 1일을 기점으로 Oracle Database Standard Edition 1과 Standard Edition 제품 판매가 중단되었으며, Standard Edition 2가 새롭게 추가 되었습니다. 또한, 2016년 8월 31일자를 기해서 Oracle SE1, SE에 대한 서포트와 보안 패치, 업그레이드 서비스가 종료되었습니다.   DBMS 시장의 강자인 Oracle Database 제품군에 변화가 생긴 것으로, 이러한 정책 변화는 다수의 사용자들에게 직접적인 영향을 주는 사안이라 국내 IT 매체에서도 이슈화를 할 것으로 생각했었습니다. 그런데, 당시 관련 기사를 검색해 보면 CIO Korea의 외신 번역기사와 데이터넷 기사 외에는 전무한 상태였으며, 개인적으로는 ‘왜 관련 기사를 쓰지 않을까?’하고 약간 의아한 생각이 들기도 했었습니다.   -> "오라클 데이터베이스 만료일에 주의하라" 애널리스트 경고 (CIO Korea, 2015-11-13) -> “SMB 시장에서 脫 오라클 바람 예고” (데이터넷, 2016-03-02)   어느덧 2년 가까운 시간이 지났기 때문에 대부분의 사용자 분들이 Oracle Database SE2 관련 정보를 습득하고 계시겠지만, 간략하게 정리를 해 보도록 하겠습니다.   구분 SE1 SE SE2 릴리...
    Date2017.10.27 Category시장 살펴보기 By정병주 Views12888 Votes0
    Read More
  3. 서버 시장의 변화 - x86 Up, Unix Down

    2008년 CUBRID가 오픈소스 DBMS로 전환하는 과정에서 내부적으로 중요한 의사결정이 있었습니다. 그것은 바로 Unix 계열 운영체제를 지원하지 않는 것이었습니다. 기존에 CUBRID는 Linux, Windows 운영체제 외에 Unix 계열 운영체제(HP HP-UX, IBM AIX, SUN Solaris)를 모두 지원하였으며, 오픈소스 전환 이후 Linux와 Windows 운영체제에만 집중하기로 한 것입니다. 당시 Unix 계열 고객사도 있었기 때문에 내부적으로 갑론을박이 있었지만, 제한된 개발 리소스로 다양한 운영체제를 지원하는 것보다는 선택과 집중을 통해 CUBRID 제품의 성능 향상과 기능 개선에 초점을 맞추었습니다. 사실, 다양한 운영체제를 지원하기 위해서는 개발 및 QA 인프라 구축, 운영체제 포팅, 그리고 서스테이닝 등 상당한 비용이 수반될 수 밖에 없습니다. 최근 IT 시장조사 기관인 가트너의 2017년 2분기 세계 서버 매출 결과를 보면 x86 서버는 출하량 2.5%, 매출 6.7% 증가한 반면, Unix 서버(RISC·아이테니엄 서버)는 각각 21.4%, 24.9% 하락했습니다. -> 관련 기사: HPE, 2017년 2분기 서버 매출 1위 유지(블로터닷넷, 2017.09.14) Unix 서버 출하량과 매출이 급격하게 추락하는 원인에는 ...
    Date2017.09.15 Category시장 살펴보기 By정병주 Views1825 Votes0
    Read More
  4. 클라우드와 리눅스, 그리고 마이크로소프트

    2014년 10월 미국 샌프란시스코에서 개최된 마이크로소프트 기자간담회에서 2월에 취임한 신임 CEO인 사티아 나델라(Satya Nadella)는 “Microsoft loves Linux”라는 메시지를 전달함으로써 시장에 충격을 주었습니다. 왜냐하면 전임 CEO인 스티브 발머(Steve Ballmer)는 리눅스를 “암(cancer)”적인 존재라는 표현으로 적대시 해왔고, 마이크로소프트 회사 자체가 독점(proprietary) 소프트웨어를 통해 엄청난 수익을 창출한 대표적인 기업이기 때문입니다.  마이크로소프트는 CEO가 바뀌었을 뿐인데 어떻게 리눅스를 바라보는 회사의 입장이 180도 바뀌었을까요? 사티아 나델라 CEO의 설명을 들어보면 이미 마이크로소프트 애저(Azure) 플랫폼의 VM (Virtual Machine) 중에 약 20% 정도가 오픈소스 운영체제라는 것입니다. 따라서, 마이크로소프트 애저 플랫폼을 확산시키기 위해서는 리눅스 사용자들을 수용할 수 밖에 없었던 것이며, 실질적으로 ‘마이크로 소프트의 밥줄은 윈도우가 아니다.’라는 기사를 확인해 보면, 2015년 4사분기 기준으로 매출 실적 1위는 클라우드 서버, 2위는 게임 부문, 3위 오피스, 4위 윈도우 순으로 나타납니다. (윈도우의 전체 매출 비중은 10%)...
    Date2017.09.06 Category시장 살펴보기 By정병주 Views1237 Votes0
    Read More
  5. 큐브리드, 글로벌을 꿈꾸다.

    큐브리드가 꿈꾸는 글로벌 .. 큐브리드의 글로벌에 대한 짧은 이야기를 시작하려고 한다. 우선, 글로벌이라는 단어를 떠 올리면 내 머릿속에는 모 그룹총수의 저서인 “세계는 넓고 할 일은 많다” 라는 책이 언뜻 떠오른다. 책을 읽었던 그 시절에 ‘만약, 세계를 목표를 어떤 일을 한다면 정말 열심히 그리고 제법 스마트한 머리로 지혜롭게 해야겠다’ 라는 생각을 가졌었던 것 같다. 물론, 그 점은 지금 시점에도 분명한 조건 중에 하나라고 믿고 있다. 왜냐하면, 글로벌은 생각보다 참 넓고 모르는 게 많기 때문이다. 오픈소스 DBMS 기업인 큐브리드가 글로벌에 대한 꿈을 꾸기 시작한 것은 제법 오래 되었고, 그 증거로 큐브리드는 이미 아시아국가에 제법 규모 있는 적용사례를 가지고 있다. 그렇지만, 큐브리드가 오픈소스로 체질을 전환한 후 본격적으로 해외를 바라보고 실행에 옮기는 것은 이번이 처음이다. 특히나, 큐브리드는 제한된 인력과 투자자금으로 글로벌화에 대하여 다른 기업들과 조금 다른 행보를 가려고 노력하고 있다. 큐브리드의 경우를 살펴보기에 앞서, 한국 소프트웨어 기업들의 눈높이를 살짝 열어 보면 이런 세가지 방향으로 정리할 수 있지 않을까...
    Date2010.03.18 Category시장 살펴보기 Bythedot Views30773 Votes0
    Read More
  6. 객체관계형 데이터베이스는 왜 성공하지 못한건가요?

    이틀 전 큐브리드닷컴 자유게시판에 "객체관계형데이터베이스는 왜 성공하지 못한건가요?"라는 제목으로 문의가 올라왔습니다. 처음에는 댓글 수준에서 간단하게 답변을 드릴까 했었는데 좀더 상세하게 설명을 드리는 것이 좋을 것 같아 정리를 해 보았습니다. 하지만, 제가 개발자나 엔지니어가 아니기 때문에 기술적인 관점보다는 전체적인 시장 관점에서 정리를 하였으며, 다른 시각 혹은 관점이 있을 수 있다는 전제하에서 출발을 하고자 합니다. 우선, 객체관계형(Object-Relational) 데이터베이스에 대해서 살펴보면, ORDB의 연구는 마이클 스톤브레이커 박사와 같은 선구자들에 의해 1980년대에 진행되었으며, 기존 관계형(Relational) 데이터베이스 개념에 객체 개념을 추가한 것입니다. 따라서, 객체지향형(Object-oriented) 데이터베이스와 달리 관계형 데이터베이스의 “편의성(표준 SQL 지원)과 성능을 계승”하고, 객체 개념을 통한 “모델링 장점”이 포함되어 있습니다. 1980년대의 리서치 이후 1990년 초중반에 상용화 제품들이 나오기 시작하는데, 대표적인 제품 중에 하나가 일러스트라(Illustra) - 일러스트라의 모태는 UC Berkeley의 Postgres 리서치 프로젝트...
    Date2010.01.30 Category시장 살펴보기 By정병주 Views44449 Votes0
    Read More
  7. DBMS시장, 그리고 CUBRID

    요즘 고민들. 어떻게 하면..? 어떻게 하면 더 많은 개발자들이 개발에 참여할까? 어떻게 하면 더 좋은 제품을 만들까? CUBRID 소스를 오픈한 후 머리 속에서 떠나지 않는 질문들이다. 누군가가 이런 질문들에 대해 실행 가능한 정답을 건네주면 참으로 좋으련만… 요즘 신문지 상에 오르내리는 자동차 업계 소식을 보고 있자니, 문득 자동차 시장과 DBMS 시장의 공통점이 많다는 생각이 든다. 자동차 시장과 DBMS 시장.. 자동차를 구매하는 소비자는 무려 80% 이상이 남성이라고 한다. DBMS 선정에 관여하는 소비자 역시 남성이 대부분을 차지하는 것은 두말하면 잔소리다. 또한, 자동차 구매와 애프터 서비스(A/S)가 유기적 관계를 이룬다는 점에서도 DBMS와 유사하다. DBMS의 경우 기술지원 서비스의 품질과 유지보수 비용을 필수적으로 고려해야 하기 때문이다. 그리고, 외산 자동차에 대한 신뢰성이 높다는 점도 유사하다. 이것은 자동차나 DBMS 의 주요 업체가 해외(미국, 일본, 독일 등)에 기반을 두고 있으며, 시장 개척자로서 장기간 더 많은 기술력을 축적했기 때문일 것이다. 주요 구매 결정 요소로는 성능, 디자인, 비용, 안전성.. 다음은 국내 경영 대학원의 논문...
    Date2008.12.24 Category시장 살펴보기 ByCUBRID_DEV Views74433 Votes0
    Read More
  8. 큐브리드 인수 및 오픈소스화에 대한 피드백

    두달 전에 내부 참고용으로 정리했던 문서를 블로그 형태로 편집하였습니다. 9월 30일 NHN 자회사인 서치솔루션의 큐브리드 인수 및 오픈소스화에 대한 피드백을 정리한 내용으로 KLDP 및 네이버 블로그/뉴스/카페를 조사하였으며(검색어: 큐브리드), 기간은 2008년 9월 30일(화)부터 10월 17일(금)까지 총 18일입니다. 1. KLDP KLDP는 국내 최대 FOSS (Free/Open Source Software) 커뮤니티로서 OSS 의견 수렴의 바로미터 사이트입니다. KLDP는 원래 LDP (Linux Documentation Project)의 한글 문서 작업 공간으로서 리눅스를 중심으로 한 자유 소프트웨어, 오픈소스 소프트웨어 전반에 걸친 문서화 작업에서 주로 많은 성과를 만들어 왔으며, 그러한 작업 결과물들은 모두 자원봉사자들의 자발적인 활동으로 이루어졌습니다. 1996년 10월에 권순선(설립/운영자)님의 개인 홈페이지로 출발하여 리눅스 관련 문서를 한글로 번역해서 인터넷으로 제공하는 것을 주 활동으로 운영되었고, 현재는 문서화뿐만 아니라 커뮤니티, 개발자 공간, 프로젝트 호스팅 등 다양한 활동들을 진행해 나가고 있는, 국내에서 가장 오래되고 가장 활성화된 FOSS 개발자/사용자 커뮤니티입니다. 10...
    Date2008.12.15 Category시장 살펴보기 By정병주 Views41392 Votes0
    Read More
Board Pagination Prev 1 Next
/ 1

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales