TECH
QUESTION
자주하는 질문답변 입니다.
Oracle
작성자 | 유건데이타 | 등록일 | 2015-05-18 |
제목 | CONTEXT 사전 관리기 사용방법 | ||
---|---|---|---|
CONTEXT 사전 관리기 사용방법
============================ Purpose ------- 이 자료에서는 Context option과 Intermedia text 에서 사용하는 사용자 사전에 데이타를 추가하고 삭제하는 사전관리기의 사용방법에 대해 설명한다. Explanation ----------- Oracle Context의 형태소 분석기에서는 4가지 사전을 사용한다. 이 사전들은 $ORACLE_HOME/ctx/data 디렉토리에 다음과 같이 존재한다. (oracle8i의 경우는 $ORACLE_HOME/ctx/data/kolx directory에 존재) - 시스템 사전 : drkosdic.dat - 문법 사전 : drkogdic.dat - 사용자 사전 : drkoudic.dat - 불용어 사전 : drkoxdic.dat 이 중에서 사용자가 수정할 수 있는 사전은 사용자 사전과 불용어 사전이며, 이 두 사전으로 사용자가 원하는 단어를 추가하거나 삭제할 수 있다. Oracle7.3.3과 8.0.3 에서는 이 화일이 text file로 되어 있기 때문에 vi등의 일반 편집기를 이용하여 편집하고 순서대로 sorting하여 저장하면 된다. Oracle7.3.4와 8.0.4 이상의 Context option에서는 사용자 사전과 불용어 사전이 속도 향상을 위해 binary file로 되어 있기 때문에 단어를 추가 또는 삭제하기 위해서는 사전 관리기를 이용해야 한다. 사전 관리기는 현재 Windows 용과 Sun Solaris 용이 있으며 다른 os의 경우는 사전을 이 두 OS에서 작업한 후에 해당 OS로 옮기면 된다. * Oracle9i에서 추가된 KOREAN_MORPH_LEXER 의 사용자 사전에 대해서는 이 방법을 사용하지 않는다. 이후부터는 사용자 사전 file이 text 로 되어 있으므로 text editor 에서 직접 추가하면 된다. [ Sun 용 사전 관리기 ] 1. $ORACLE_HOME/ctx/data/oradict dictory를 생성하고 oradict-sun.tar file을 oradict directory아래 옮긴 후에 tar를 푼다. $ cd $ORACLE_HOME/ctx/data/oradict $ tar -xvf oradict_sun.tar 실행하면 Dictmng 화일이 생성된다. 2. $ORACLE_HOME/ctx/data/drkoxdoc.dat, drkoudic.dat file을 oradict directory로 옮긴다. drkoudic.dat file은 사용자 사전 화일이고, drkoxdic.dat file은 불용어 사전 화일이다. 3. 사전 관리기 사용방법 다음과 같이 명령어를 확인해 볼 수 있다. $ Dictmng DICTIONARY MANAGER v1.0 USAGE : Dictmng -s -q Word when System Dict Lookup Dictmng -u -n text-file-name when User Dict Creation Dictmng -u -a text-file-name when User Dict Append Dictmng -u -q text-file-name when User Dict Lookup Dictmng -u -d text-file-name when User Dict Delete Dictmng -x -n text-file-name when Stop word Dict Creation Dictmng -x -a text-file-name when Stop word Dict Append Dictmng -x -q text-file-name when Stop word Dict Lookup Dictmng -x -d text-file-name when Stop word Dict Delete (1) 사용자 사전 관리 . 사용자 사전에 있는 단어를 확인하는 방법 $ Dictmng -u -q word.txt -> 실행되면 현재 사용자 사전에 있는 단어 리스트가 word.txt file로 나온다. . 사용자 사전에 단어를 추가하는 방법 - 원하는 단어를 text file(Ex:addword.txt)로 생성해 둔다. - 다음과 같이 실행한다. $ Dictmng -u -a addword.txt - 추가가 되었는 지 확인한 후에 $ORACLE_HOME/ctx/data 로 drkoudic.dat file을 옮긴다. . 사용자 사전에 있는 단어를 삭제하는 방법 - 삭제하기 원하는 단어를 text file(EX:delword.txt)로 생성한다. - 다음과 같이 실행한다. $ Dictmng -u -d delword.txt - 리스트에서 삭제가 되었는 지 확인하고 drkoudic.dat file을 원래 위치로 옮긴다. (2) 불용어 사전 관리 . 불용어 사전에 있는 단어를 확인하는 방법 $ Dictmng -x -q stopword.txt -> 실행되면 현재 불용어 사전에 있는 단어 리스트가 stopword.txt file로 나온다. . 불용어 사전에 단어를 추가하는 방법 - 원하는 단어를 text file(Ex:addstopword.txt)로 생성해 둔다. - 다음과 같이 실행한다. $ Dictmng -x -a addstopword.txt - 추가가 되었는 지 확인한 후에 $ORACLE_HOME/ctx/data 로 drkoxdic.dat file을 옮긴다. . 불용어 사전에 있는 단어를 삭제하는 방법 - 삭제하기 원하는 단어를 text file(EX:delstopword.txt)로 생성한다. - 다음과 같이 실행한다. $ Dictmng -x -d delstopword.txt - 리스트에서 삭제가 되었는 지 확인하고 drkoxdic.dat file을 원래 위치로 옮긴다. [ Windows 용 사전 관리기 ] 특정 directory에 oradict_win.zip file을 풀어둔다. Windows 용 사전 관리기는 Oracle Context option과 다른 이름의 사전 관리기를 인식하므로 실행하기 전에 다음과 같은 이름으로 바꾸어 주어야 한다. ren drkoudic.dat UDict.3ma ren drkoxdic.dat XDict.3ma 명령어는 다음과 같다. dictmng32 -s -q Word when System Dict Lookup dictmng32 -u -n text-file-name when User Dict Creation dictmng32 -u -a text-file-name when User Dict Append dictmng32 -u -q text-file-name when User Dict Lookup dictmng32 -u -d text-file-name when User Dict Delete dictmng32 -x -n text-file-name when Stop word Dict Creation dictmng32 -x -a text-file-name when Stop word Dict Append dictmng32 -x -q text-file-name when Stop word Dict Lookup dictmng32 -x -d text-file-name when Stop word Dict Delete 위의 Sun의 경우와 같은 방법으로 작업을 한 후에 다음과 같이 사전의 화일 이름을 바꾼다. ren UDict.3ma drkoudic.dat ren XDict.3ma drkoxdic.dat drkoudic.dat 와 drkoxdic.dat file을 원래 위치로 옮긴다. |
Comment | |||
---|---|---|---|
등록된 코멘트가 없습니다. |