DocumentExtractor 의 기본 구조

국내 유명 업체의 문서추출기가 있겠지만, 굳이 hwp를 사용하지 않는다면 이용할 필요가 없다. 문서추출기(Document Extractor)에 대한 오픈소스가 많이 있지만 여기서 소개할 것은 Apache POI를 이용해서 좀더 쓰기 쉽게 만든 자바(java) 기반의 문서추출기인 DocumentExtractor 이다. 본 소스는 github 를 통해서 제공하고 있다.  ![](http://ash84.net/wp-content/uploads/1/cfile23.uf.192A634050476F440625E3.jpg)codercat DocumentExtractor… Read More