OCR (광학적 문자 인식)
종이 문서를 스캔하여 전자 형식으로 컴퓨터에 저장하여 보다 효율적으로 문서 관리를 진행하고 저장 공간을 절약할 수 있습니다. 하지만 특정 단어나 문구에 관련된 정보를 찾으려면 모든 파일을 열고 문서를 읽어야 합니다. OCR (광학적 문자 인식) 기능을 사용하면 스캔한 문서에서 텍스트가 검색 가능하므로 내용을 쉽게 검색하거나 편집할 수 있습니다.
OCR은 인쇄된 이미지 텍스트를 컴퓨터가 읽고, 검색 및 편집 가능한 텍스트로 변환합니다.
단일 파일에서 OCR 실행
OCR을 실행하여 스캔한 문서를 검색 및 편집 가능하게 만들 수 있습니다. 또한 검토 및 주석 도구를 사용하여 주석을 추가하거나 마크업을 표시할 수 있습니다. 렌더링 가능한 텍스트(컴퓨터에서 생성된 이미지 레이어 위에 배치된 텍스트)가 있는 페이지에 대해 OCR을 실행할 수 없습니다.
현재 문서에서 OCR 실행
-
Right PDF Editor에서 OCR을 실행할 PDF 문서를 엽니다.
-
[고급] > [텍스트 인식] > [OCR]
을 선택하고 옵션에서 [현재 파일]을 선택합니다.
-
[OCR 텍스트 인식] 대화 상자에서 원하는 대로 OCR 설정을 조정합니다.
-
페이지 범위 모든 페이지, 현재 페이지 또는 선택한 페이지를 인식하도록 선택합니다.
-
페이지 기울기 자동 보정 이 확인란을 선택하면 Right PDF Editor가 자동으로 페이지 방향을 조정합니다.
-
PDF 유형 출력 PDF유형을 선택합니다.
-
검색 가능 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
-
검색 및 편집 가능 텍스트 이미지를 검색 및 편집 가능한 텍스트로 변환합니다.
-
MRC PDF 문서 MRC를 사용하여 이미지를 압축합니다.
-
검색 가능한 MRC MRC를 사용하여 이미지를 압축하고 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
-
MRC 압축 압축 수준을 설정합니다. 압축 수준이 높을수록 파일 크기는 작아지고 품질은 떨어집니다. MRC는 텍스트 요소를 이미지 또는 배경과 분리하고 각 요소에 최적의 압축을 적용합니다.
-
인식할 언어 문자를 식별하는데 사용할 OCR엔진의 언어를 선택합니다. 최적의 OCR 결과를 얻으려면 [인식할 언어] 목록에서 문서에 포함된 언어만 선택합니다. 여러 언어를 선택할 때 다음과 같은 제한 사항이 있습니다.
-
아시아 언어를 하나만 선택하거나 라틴 문자 또는 키릴 문자를 사용하는 언어를 하나 이상 선택합니다.
-
아시아 언어는 다른 언어와 혼합할 수 없습니다.
참고: 문서가 이러한 제한을 초과하는 경우, [자동 언어 감지] 확인란을 선택합니다.
-
자동 언어 감지 이 확인란을 선택하면 Right PDF Editor는 각 페이지에 적합한 언어를 감지하고 적용합니다.

-
[확인]을 클릭합니다.
여러 파일에서 OCR 실행
-
[고급] > [텍스트 인식] > [OCR]
을 선택하고 옵션에서 [여러 파일]을 선택합니다.
-
[OCR 텍스트 인식] 대화 상자에서 OCR을 실행할 파일을 찾아 선택하고 [확인]을 클릭합니다.
-
파일 추가... Ctrl 키를 누른 채 클릭하여 여러 파일을 선택하고 [열기]를 클릭합니다. 선택된 파일이 파일 목록에 추가됩니다.
-
폴더 추가... 폴더를 선택하고 [확인]을 클릭합니다. 선택된 폴더 내의 모든 파일이 파일 목록에 추가됩니다.
-
제거 파일을 하나 선택하거나 Ctrl 키를 누른 채 클릭하여 여러 파일을 선택한 다음 [제거]를 클릭합니다. 선택된 파일이 목록에서 제거됩니다.
-
현재 열린 파일을 포함 파일 목록에 현재 열려 있는 모든 PDF 파일을 포함하려면 이 확인란을 선택합니다.
-
[출력 옵션] 대화 상자에서 저장 위치와 출력 PDF 파일의 명명 방법을 지정한 다음 [확인]을 클릭합니다.
-
대상 폴더 원본과 동일한 폴더 또는 특정 폴더에 저장할 것인지 선택합니다.
-
파일 이름 지정 원래 파일 이름을 유지할지 또는 원래 파일 이름에 접두사/접미사를 추가시킬지 선택합니다. 원래 파일 이름에 접두사/접미사를 추가하려면 [원래 파일 이름에 추가]를 선택한 다음 [다음 항목 앞에 삽입] 또는 [뒤에 삽입] 상자에 문자를 입력하여 출력 파일 이름이 "텍스트 삽입+원래 파일 이름+텍스트 삽입.pdf" 형식으로 되도록 지정합니다. [원래 파일 이름 유지]를 선택한 경우, [기존 파일 덮어쓰기] 확인란을 선택해야만 출력 PDF 파일이 원래 파일을 덮어씁니다.
-
[OCR 텍스트 인식 – 설정] 대화 상자에서 다음 설정을 조정합니다.
-
페이지 기울기 자동 보정 이 확인란을 선택하면 Right PDF Editor가 자동으로 페이지 방향을 조정합니다.
-
PDF 유형 출력 PDF유형을 선택합니다.
- 검색 가능 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
-
검색 및 편집 가능 텍스트 이미지를 검색 및 편집 가능한 텍스트로 변환합니다.
-
MRC PDF문서 MRC를 사용하여 이미지를 압축합니다.
-
검색 가능한 MRC MRC를 사용하여 이미지를 압축하고 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
-
MRC 압축 압축 수준을 설정합니다. 압축 수준이 높을수록 파일 크기는 작아지고 품질은 떨어집니다. MRC는 텍스트 요소를 이미지 또는 배경과 분리하고 각 요소에 최적의 압축을 적용합니다.
-
인식할 언어 문자를 식별하는데 사용할 OCR엔진의 언어를 선택합니다. 최적의 OCR 결과를 얻으려면 [인식할 언어] 목록에서 문서에 포함된 언어만 선택합니다. 여러 언어를 선택할 때 다음과 같은 제한 사항이 있습니다.
-
자동 언어 감지 이 확인란을 선택하면 Right PDF Editor는 각 페이지에 적합한 언어를 감지하고 적용합니다.
-
[확인]을 클릭합니다. 페이지에 렌더링 가능한 텍스트가 포함된 경우, 컴퓨터에서 생성된 텍스트를 인식(OCR)할 수 없다는 메시지가 표시됩니다.

OCR 서스펙트 수정
[추정 대상 찾기] 기능은 잠재적인 인식 오류를 발견하고 텍스트를 수정하기 위한 옵션을 제공합니다. 이 기능은 스캔한 문서를 검색 가능하게 만든 후에만 사용할 수 있습니다. 원본 문서가 선명할수록 서스펙트가 적게 나타납니다.
OCR 서스펙트 찾기 및 바꾸기
-
OCR을 실행할 스캔한 PDF 문서를 엽니다. 복사본을 만들고 복사본에서만 OCR을 실행합니다.
-
[고급] > [텍스트 인식] > [OCR]
을 선택하고 필요에 따라 메뉴에서 [현재 파일] 또는 [여러 파일]을 선택한 다음 텍스트를 검색 가능하게 만들지 또는 검색 및 편집 가능하게 만들지를 선택합니다. 자세한 내용은 현재 문서에서 OCR 실행을 참조하십시오.
참고: [추정 대상 찾기] 기능은 OCR을 수행할 때 [검색 가능]을 선택한 경우에만 사용할 수 있습니다. 텍스트를 검색 가능하게 만들 후 여전히 원본 스캔한 문서의 모양을 유지합니다.
-
문서의 텍스트를 검색 가능하게 만든 후 [추정 대상 찾기]를 사용하여 OCR 엔진이 올바르게 인식하지 못한 내용이 있는지 검토하고 수정합니다. [고급] > [텍스트 인식] > [추정 대상 찾기]
를 선택한 다음 필요에 따라 다음 옵션 중 하나를 선택합니다.

-
[요소 찾기] 대화 상자에서 [찾기]를 클릭하여 서스펙트를 강조 표시합니다. 서스펙트 텍스트가 페이지에서 강조 표시되는 동시에 [원본 문서] 상자(A)에 표시됩니다. 다음 옵션을 사용하여 서스펙트 작업을 수행할 수 있습니다.
-
-
[동의 및 찾기](B)를 클릭하여 해석이 정확함을 확인하고 다음 서스펙트로 이동합니다. OCR 엔진이 식별한 OCR 텍스트 필드에 표시된 텍스트가 올바르지 않은 경우, 새 텍스트를 입력하고 [동의 및 찾기]를 클릭하여 수정한 텍스트로 교체합니다.
-
[다음 찾기](C)를 클릭하여 다음 서스펙트로 이동합니다.
-
서스펙트가 텍스트로 올바르게 식별되지 않은 경우 [텍스트가 아님](D)을 클릭합니다.
