- HOME
- Post in | and so on
- Post at | 2014. 12. 3. 19:54 | by 밀크빵.
- View comment
초성검색
Q) 초성으로 검색하는 기능을 추가하려고 합니다. 어떻게 구현하면 좋을까요?
저는 트리를 이용한 검색을 설명했습니다.
RQ) 이 방법 보다는 인덱싱을 사용하면 좋을 것 같은데 어떻게 생각하나요? 재질문으로 인덱싱을 사용한 검색기능 구현법을 질문하셨습니다.
C++ 코드와 설명 출처: 데브피아
;- 유니코드 한글의 자모 분리법.
;
;
; 유니코드 완성형 한글 코드는 배치가 매우 잘되어 있어서 초성 중성 종성의 분리가 가능하다.
;
; wchar_t CompleteCode = L'가';
; 이렇게 완성형 코드가 있을 때
;
; wchar_t UniValue = CompleteCode - 0xAC00;
;
; 0xAC00은 한글 코드의 시작 값이다. 따라서 저 값을 빼면
; 우선적으로 우리가 원하는 한글 값만을 가지게 된다.
;
; 이제 저장한 UniValue로부터 종성을 분리한다.
; wchar_t Jong = UniValue % 28;
;
; 유니코드에서 사용가능한 초성은 19개, 중성은 21개, 종성은 28개이고
; 유니코드가 같는 값의 공식은
;
; 유니코드 완성형 값 = ( ( ( 초성 * 21 ) + 중성 ) * 28 ) + 종성 + 0xAC00;
;
; 이렇게 된다. 따라서 UniValue에서 28로 나눈 나머지는 종성이 된다.
;
; 이번에는 중성을 찾는다.
; wchar_t Jung = ( ( UniValue - Jong ) / 28 ) % 21;
; wchar_t Cho = ( ( UniValue - Jong ) / 28 ) / 21;
;
; 이렇게 하여 유니코드 완성형 값에서 초성, 중성, 종성의 값을 분리해낼 수 있다.
; 주의할 점은 저렇게 나오는 값은 인덱스 값이라는 점이다.
; 정확한 자모 값을 받기 위해서는 유니코드 한글 자모 코드표를 통해서
; 초성에는 초성 시작 값을 더해주고, 중성에는 중성 시작값을,
; 종성에는 종성의 시작값을 더해주어야 정확한 자모 값을 얻을 수 있다.
;
; 자, 이제 코드를 살펴보자...
;
; // unicode3.cpp
; #include <windows.h>
; #include <iostream>
; #include <locale>
;
; using namespace STD;
;
; INT main()
; {
; wcout.imbue( locale("korean") );
;
; wchar_t CompleteCode = L'개';
; wchar_t UniValue = CompleteCode - 0xAC00;
;
; wchar_t Jong = UniValue % 28;
; wchar_t Jung = ( ( UniValue - Jong ) / 28 ) % 21;
; wchar_t Cho = ( ( UniValue - Jong ) / 28 ) / 21;
;
; cout << "초성 : " << Cho << "\t" << "중성 : " << Jung << "\t" << "종성 : " << Jong << endl;
; }
;
; 위와 같은 코드를 작성하여 살펴보면 '개'의 초성은 'ㄱ'이고, 중성은 'ㅐ', 종성은 없다.
; 따라서 'ㄱ'은 자모 코드 중 초성의 첫번째이므로 0의 값을 가지며,
; 'ㅐ'는 중성의 두번째이므로 1의 값을 가지고 종성은 없으므로 0의 값을 가지게 된다.
; 문제점은 종성의 0이다. 한글 코드는 초성이 없는 경우가 없고, 중성이 없는 경우는 없으나
; 종성이 없는 경우는 있다. 따라서 종성의 인덱스는 1부터 시작해야 한다.
; 저 위의 코드 중 L'개'를 L'객'으로 바꿔 살펴보면 종성 값이 1로 나오는 것을 확인할 수 있다.
;
; 유니코드의 자모값의 코드표에 대하여 알고 싶을 경우
; http://www.unicode.org/charts/PDF/U1100.pdf
;
; 그리고 한글 완성형 코드표에 대하여 알고 싶을 경우
; http://www.unicode.org/charts/PDF/UAC00.pdf
; 위의 링크에 가면 된다.
UniValue = Asc("객") - $AC00
Debug UniValue
jong = UniValue % 28
jung = ( ( UniValue - jong ) / 28 ) % 21
cho = ( ( UniValue - jong ) / 28 ) / 21
;각각의 인덱스 출력.
Debug cho
Debug jung
Debug jong
;실제 자모의 출력.
Debug Chr(cho+$1100)
Debug Chr(jung+$1161)
If jong ;종성이 있으면 이하 처리.
Debug Chr(jong+$11a7)
EndIf
실행 결과
http://titus.uni-frankfurt.de/unicode/unitestx.htm
유니코드 한글 시작 부분 (AD00부터 시작)
http://titus.uni-frankfurt.de/unicode/unitestx.htm#UAD00
유니코드 한글 코드표(개인블로그)
http://sexy.pe.kr/tc/113
[출처] 초성검색[그래텍_2차실무면접]|작성자 sang_it
'and so on' 카테고리의 다른 글
상속 vs 포함 (포함 예제) (0) | 2014.12.03 |
---|---|
상속 vs 포함 (0) | 2014.12.03 |
인덱싱 (0) | 2014.12.03 |
11/25 Build Your Own Webpage 1~6 (0) | 2014.11.25 |
11/17 HTML Basics 1~8 (0) | 2014.11.17 |