Recent Posts
Recent Comments
Link
관리 메뉴

NaggingMachine

형태소 분석기 무료로 지금 당장 사용하기 (샘플 코드 제공) 참 쉽죠잉~ 본문

TechnoBabbler

형태소 분석기 무료로 지금 당장 사용하기 (샘플 코드 제공) 참 쉽죠잉~

naggingmachine 2013. 7. 25. 14:29

간단하게 작업해야하는게 있어서 형태소 분석기를 찾아봤다. 여기저기에서 만든 프로젝트들이 있고, 크게는 서울대와 KAIST에서 연구중인 프로젝트가 있는데, 꼬꼬마는 어딜봐도 사전을 찾기가 어려워서 사용하기를 포기. 그런데 KAIST에서 공개한 프로젝트, 한나눔 한국어 형태소 분석기 (HanNanum)에는 사전도 포함되어 있고 실제로 사전을 임의로 구축하기도 매우 쉬워서 확장 가능성도 높겠다 싶어서 사용해보기로 했다. 인상적인 부분은 workflow라는 구조를 채택해서 형태소 분석 자체를 플러그인 방식으로 처리하도록 했다.


- 프로젝트 홈페이지: http://kldp.net/projects/hannanum

- 다운로드: http://kldp.net/projects/hannanum/download

- 블로그에서 직접 다운로드: 

JHanNanum-0.8.4-ko.zip


- 내가 만든 초간단 버전

nanum.zip


0.8.4 버전으로 만든 초간단 샘플 프로젝트이다. 프로젝트 홈페이지로 가면 GUI Demo도 확인할 수 있으니 꼭 확인해보길 바란다.


참고로 프로젝트 홈페이지에서 파일을 다운로드한 경우에는 반드시 conf.zip과 data.zip을 압축해제 해야 하는데, conf.zip의 경우 압축해제하면 conf/plugin 구조가 아닌 plugin으로 해제되어 오류가 발생하게 되니 반드시 conf 폴더를 생성한 다음 압축 해제하여 conf/plugin 구조가 만들어질 수 있도록 하자.