Oracle

게시글 보기
작성자 유건데이타 등록일 2015-05-18
제목 CONTEXT 사전 관리기 사용방법
CONTEXT 사전 관리기 사용방법
============================


Purpose
-------
이 자료에서는 Context option과 Intermedia text 에서 사용하는
사용자 사전에 데이타를 추가하고 삭제하는 사전관리기의 사용방법에
대해 설명한다.


Explanation
-----------

Oracle Context의 형태소 분석기에서는 4가지 사전을 사용한다.
이 사전들은 $ORACLE_HOME/ctx/data 디렉토리에 다음과 같이 존재한다.
(oracle8i의 경우는 $ORACLE_HOME/ctx/data/kolx directory에 존재)

- 시스템 사전 : drkosdic.dat
- 문법 사전 : drkogdic.dat
- 사용자 사전 : drkoudic.dat
- 불용어 사전 : drkoxdic.dat

이 중에서 사용자가 수정할 수 있는 사전은 사용자 사전과 불용어 사전이며,
이 두 사전으로 사용자가 원하는 단어를 추가하거나 삭제할 수 있다.

Oracle7.3.3과 8.0.3 에서는 이 화일이 text file로 되어 있기 때문에
vi등의 일반 편집기를 이용하여 편집하고 순서대로 sorting하여 저장하면 된다.

Oracle7.3.4와 8.0.4 이상의 Context option에서는 사용자 사전과
불용어 사전이 속도 향상을 위해 binary file로 되어 있기 때문에
단어를 추가 또는 삭제하기 위해서는 사전 관리기를 이용해야 한다.

사전 관리기는 현재 Windows 용과 Sun Solaris 용이 있으며 다른 os의 경우는
사전을 이 두 OS에서 작업한 후에 해당 OS로 옮기면 된다.

* Oracle9i에서 추가된 KOREAN_MORPH_LEXER 의 사용자 사전에 대해서는
이 방법을 사용하지 않는다. 이후부터는 사용자 사전 file이 text 로 되어
있으므로 text editor 에서 직접 추가하면 된다.


[ Sun 용 사전 관리기 ]

1. $ORACLE_HOME/ctx/data/oradict dictory를 생성하고 oradict-sun.tar
file을 oradict directory아래 옮긴 후에 tar를 푼다.

$ cd $ORACLE_HOME/ctx/data/oradict
$ tar -xvf oradict_sun.tar

실행하면 Dictmng 화일이 생성된다.

2. $ORACLE_HOME/ctx/data/drkoxdoc.dat, drkoudic.dat file을
oradict directory로 옮긴다.
drkoudic.dat file은 사용자 사전 화일이고,
drkoxdic.dat file은 불용어 사전 화일이다.

3. 사전 관리기 사용방법

다음과 같이 명령어를 확인해 볼 수 있다.

$ Dictmng
DICTIONARY MANAGER v1.0
USAGE :
Dictmng -s -q Word when System Dict Lookup
Dictmng -u -n text-file-name when User Dict Creation
Dictmng -u -a text-file-name when User Dict Append
Dictmng -u -q text-file-name when User Dict Lookup
Dictmng -u -d text-file-name when User Dict Delete
Dictmng -x -n text-file-name when Stop word Dict Creation
Dictmng -x -a text-file-name when Stop word Dict Append
Dictmng -x -q text-file-name when Stop word Dict Lookup
Dictmng -x -d text-file-name when Stop word Dict Delete


(1) 사용자 사전 관리

. 사용자 사전에 있는 단어를 확인하는 방법

$ Dictmng -u -q word.txt
-> 실행되면 현재 사용자 사전에 있는 단어 리스트가 word.txt file로
나온다.

. 사용자 사전에 단어를 추가하는 방법

- 원하는 단어를 text file(Ex:addword.txt)로 생성해 둔다.
- 다음과 같이 실행한다.
$ Dictmng -u -a addword.txt

- 추가가 되었는 지 확인한 후에 $ORACLE_HOME/ctx/data 로
drkoudic.dat file을 옮긴다.

. 사용자 사전에 있는 단어를 삭제하는 방법

- 삭제하기 원하는 단어를 text file(EX:delword.txt)로 생성한다.
- 다음과 같이 실행한다.
$ Dictmng -u -d delword.txt

- 리스트에서 삭제가 되었는 지 확인하고 drkoudic.dat file을 원래 위치로
옮긴다.

(2) 불용어 사전 관리

. 불용어 사전에 있는 단어를 확인하는 방법

$ Dictmng -x -q stopword.txt
-> 실행되면 현재 불용어 사전에 있는 단어 리스트가 stopword.txt file로
나온다.

. 불용어 사전에 단어를 추가하는 방법

- 원하는 단어를 text file(Ex:addstopword.txt)로 생성해 둔다.
- 다음과 같이 실행한다.
$ Dictmng -x -a addstopword.txt

- 추가가 되었는 지 확인한 후에 $ORACLE_HOME/ctx/data 로 drkoxdic.dat
file을 옮긴다.

. 불용어 사전에 있는 단어를 삭제하는 방법

- 삭제하기 원하는 단어를 text file(EX:delstopword.txt)로 생성한다.
- 다음과 같이 실행한다.
$ Dictmng -x -d delstopword.txt

- 리스트에서 삭제가 되었는 지 확인하고 drkoxdic.dat file을 원래 위치로
옮긴다.


[ Windows 용 사전 관리기 ]


특정 directory에 oradict_win.zip file을 풀어둔다.
Windows 용 사전 관리기는 Oracle Context option과 다른 이름의
사전 관리기를 인식하므로 실행하기 전에 다음과 같은 이름으로 바꾸어
주어야 한다.

ren drkoudic.dat UDict.3ma
ren drkoxdic.dat XDict.3ma

명령어는 다음과 같다.

dictmng32 -s -q Word when System Dict Lookup
dictmng32 -u -n text-file-name when User Dict Creation
dictmng32 -u -a text-file-name when User Dict Append
dictmng32 -u -q text-file-name when User Dict Lookup
dictmng32 -u -d text-file-name when User Dict Delete
dictmng32 -x -n text-file-name when Stop word Dict Creation
dictmng32 -x -a text-file-name when Stop word Dict Append
dictmng32 -x -q text-file-name when Stop word Dict Lookup
dictmng32 -x -d text-file-name when Stop word Dict Delete

위의 Sun의 경우와 같은 방법으로 작업을 한 후에 다음과 같이
사전의 화일 이름을 바꾼다.

ren UDict.3ma drkoudic.dat
ren XDict.3ma drkoxdic.dat

drkoudic.dat 와 drkoxdic.dat file을 원래 위치로 옮긴다.
Comment
등록된 코멘트가 없습니다.