PDF 텍스트 추출, 편집가능한 문서로 변환하기

Posted by 이미지
2017. 5. 28. 07:42 프로그램

PDF 텍스트 추출, 편집가능한 문서로 변환하기



PDF 파일은 문서자체를 이미지로 저장하기 때문에 라이센스 프로그램 없이는 별도의 편집이 불가능합니다. 때문에 다른 형식의 문서로 변환하거나 일부 페이지만 분리해내는 등 여러 가지 사이트에서 PDF편집 서비스를 제공하고 있는데요.



워드나 한글 등의 다른 문서형식으로 변환을 하더라도 표, 그림 등 문서의 양식이 깨지는 경우가 많아 PDF 파일에서 텍스트를 복사하거나 잘라내는 등의 편집에는 한계가 있습니다. 이러한 한계로 불편함을 겪고 계시다면 오늘 소개하는 PDF 편집프로그램에 주목해보세요.




NES PDF는 개인에게 무료로 제공되는 프리웨어로 윈도우7, 8, 10에서 이용 가능합니다. 학교나 공공기관, 기업 등에서 이용을 원할 때에는 라이센스 구입이 필요하므로 개인용을 먼저 이용해 보신 뒤 구입여부를 판단하셔도 좋겠습니다.


NES PDF 다운로드 바로가기  http://www.nespdf.com/download/down_priv.php


위 링크를 이용하면 무료 설치가 가능합니다. 설치과정은 어렵지 않으므로 시스템에 맞는 버전을 선택한 뒤 내려받아 진행하시기 바랍니다.



PDF 텍스트 추출 기능을 설명하기 앞서 NesPDF의 주요 기능을 살펴보면 새로운 PDF 문서를 생성하거나 워드, 엑셀, 이미지, text 파일로 역변환, 주석처리, 보안설정, PDF 파일용량 줄이기, 문서읽어주기 등이 있습니다.


제가 사용해본 PDF 편집프로그램들과 비교해보아도 다양하고 깔끔한 작업수준을 제공하고 있는데요. 특히 텍스트편집 기능은 글자만 추출해 text 파일로 저장하는 것이 아닌 문서양식을 보존한 채 글차편집이 가능하기 때문에 더욱 편리하게 사용할 수 있습니다.



그럼 실제 문서를 불러와 작업하는 과정을 살펴보겠습니다. 프로그램을 실행한 뒤 작업할 파일을 열면 문서영역은 아무리 마우스로 드래그를 해보아도 영역이 지정되지 않도록 쓰기가 금지되어 있습니다. 



PDF 텍스트 추출을 위해 [쓰기 가능한 PDF로 변환]을 클릭합니다. 변환 시 기존 태그와 레이어가 제거되며 재포맷될 수 있으나 제가 사용해본 결과 크게 깨지는 부분은 없었던 것 같습니다.



변환방법에서 문서와 양식 중 선택하여 변환을 클릭합니다. 이때 문서는 글자를 하나하나 인식하는 일반문서로 변환되며 양식은 텍스트 상자나 양식필드 등 프레임 텍스트를 가진 양식으로 변환하는 것입니다. 또한 변환범위를 모든페이지, 현재페이지, 페이지 단위로 선택할 수 있어 작업속도를 높일 수 있습니다.



변환된 문서는 새창으로 열리며 원하는 부분에 드래그로 영역 지정이 가능해집니다. 글자부분을 드래그 했더니 잘라내기, 복사, 붙여넣기, 삭제, 모두선택 등 작업메뉴가 생성되네요. 



이제 PDF 파일로부터 글자만 추출해내거나 불필요한 부분을 삭제 또는 하이라이트 표시 등 다양하게 편집하고 저장할 수 있게 되었습니다. 다른 프로그램이나 사이트에서도 텍스트를 추출해내는 기능을 제공하고 있지만 많은 경우 text.파일로 변환하는데 그치는 것 같습니다. 조금 더 다양한 편집기능을 원한다면 NesPDF를 이용해보세요.


반응형