* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.
Window7 32bit, Linux 64bit 등 | |
[cubrid_rel] 수행 결과 | |
[도움말]-[버전정보] 확인 | |
java, php, odbc 등 입력 |
* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.
에러 내용 및 재현 방법 | 재현 가능한 Source와 SQL |
관련 테이블(인덱스, 키정보 포함) 정보 | CUBRID 홈 디렉토리 아래 log 디렉토리 압축 |
-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
substr시 질의결과에 마름모물음표가 나오는데..
이건 substr 시 뒤에 결과가 더 있는걸 의미하는거 같은데..
표식이 안되게 하는 설정 같은게 있을까요??
질문에 CUBRID 버전이 명시되어 있지 않는데 CUBRID 9.x 전 버전에서는 문자셋 설정 기능이 없어 한글 저장 시 byte 데이터가 그대로 저장됩니다.
이로인해 substr, length와 같이 데이터 길이와 관련된 함수에서 처리 단위는 byte입니다.
utt8 형식의 한글이라면 한글 한자는 3btye, euc_kr의 경우 2btye를 차지합니다.
따라서 substr('경상남도', 1, 10)는 '경상남도'의 처음 부터 10byte만큼 리턴하라는 것이고, utf8로 저장된 경우 질문하신 내용과 같이 9byte '경상남'까지 정상적으로 가져오고, 나머지 1byte를 가져오면서 1byte로는 한글이 완성되지 않아 깨져 나타나게 되는 것 입니다.
참고로 CUBRID9.x 버전을 사용하는 경우에도 CUBRID_CHARSET을 'ko_KR.utf8로 지정해서 DB를 생서하지 않으면 기본적으로 en_US로 설정되어 한글이 byte 처리되어 동일한 현상이 나타나게 됩니다.