MS Office 문서 변환 명령어 정리.

최근에 문서파일 내 텍스트 추출에 대한 오픈소스(Apache.POI)를 패키징해서 테스트 하던 중에 비정상적인 MS 2003-2007 문서에 대한 내용추출이 안되는 문제가 있었다. 오픈소스 자체의 한계인지도 모르겠지만, 찾은 대안중에 하나가 바로 이러한 문서들을 상위버전의 문서로 변환해서 내용을 추출하는 것이다. 즉, ppt, doc, xls 등의 확장자를 가진 문서들을 pptx, xlsx, docx 로 만들어서 오픈소스(Apache.POI)… Read More