OCR (광학적 문자 인식)
OCR (관학적 문자 인식)은 전자지 장치(예: 스캐너 또는 디지털 카메라)가 종이에 인쇄된 문자를 검사하고 어둡고 밝은 패턴을 감지하여 모양을 결정한 다음 문자 인식 방법을 사용하여 모양을 컴퓨터 텍스트로 변환하는 프로세스를 말합니다. 즉 이미지의 텍스트를 텍스트 형식으로 변환하는 프로세스입니다. OCR 기능을 사용하면 스캔한 문서의 텍스트를 검색 및 편집 가능하게 만들 수 있습니다.
현재 문서에서 OCR 실행
렌더링 가능한 텍스트(컴퓨터에서 생성된 텍스트가 이미지 레이어 위에 배치)가 포함된 페이지에서는 OCR을 수행할 수 없습니다.
-
Right PDF macOS에서 OCR을 실행할 PDF 문서를 엽니다.
-
[고급] > [OCR]를 선택하고 [현재 파일]을 선택합니다.
-
[OCR 텍스트 인식] 대화 상자에서 필요에 따라 OCR 설정을 조정합니다.
-
페이지 범위 모든 페이지, 현재 페이지 또는 선택한 페이지를 인식하도록 선택합니다.
-
페이지 기울기 자동 보정 이 확인란을 선택하면 Right PDF macOS가 자동으로 페이지 방향을 조정합니다.
-
PDF 유형 출력 PDF 유형을 선택합니다.
-
검색 가능 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
-
검색 및 편집 가능 텍스트 이미지를 검색 및 편집 가능한 텍스트로 변환합니다.
-
MRC PDF 문서 MRC를 사용하여 이미지를 압축합니다.
-
검색 가능한 MRC MRC를 사용하여 이미지를 압축하고 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
-
MRC 압축 압축 수준을 설정합니다. 압축 수준이 높을수록 파일 크기는 작아지고 품질은 떨어집니다. MRC는 텍스트 요소를 이미지 또는 배경과 분리하고 각 요소에 최적의 압축을 적용합니다.
-
인식할 언어 문자를 식별하는데 사용할 OCR 엔진의 언어를 선택합니다. 최적의 OCR 결과를 얻으려면 [인식할 언어] 목록에서 문서에 포함된 언어만 선택합니다. 여러 언어를 선택할 때 다음과 같은 제한 사항이 있습니다.
-
아시아 언어를 하나만 선택하거나 라틴 문자 또는 키릴 문자를 사용하는 언어를 하나 이상 선택합니다.
-
아시아 언어는 다른 언어와 혼합할 수 없습니다.
참고: 문서가 이러한 제한을 초과하는 경우, [자동 언어 감지] 확인란을 선택합니다.
-
자동 언어 감지 이 확인란을 선택하면 Right PDF는 각 페이지에 적합한 언어를 감지하고 적용합니다.
-
[확인]을 클릭합니다.
여러 파일에서 OCR 실행
-
[고급] > [OCR]를 선택하고 [여러 파일]을 선택합니다.
-
[OCR 텍스트 인식] 대화 상자에서 OCR을 실행할 파일을 찾아 선택하고 [확인]을 클릭합니다.
-
파일 추가...목록에 하나 이상의 파일을 추가합니다. Command 키를 누른 채 클릭하여 여러 파일을 선택합니다.
-
폴더 추가... 폴더를 선택하고 [선택]을 클릭합니다. 선택된 폴더 내의 모든 파일이 파일 목록에 추가됩니다.
-
제거 파일을 하나 선택하거나 Command 키를 누른 채 클릭하여 여러 파일을 선택한 다음 [제거]를 클릭합니다. 선택된 파일이 목록에서 제거됩니다.
-
현재 열린 파일을 포함 파일 목록에 현재 열려 있는 모든 PDF 파일을 포함하려면 이 확인란을 선택합니다.
-
[설정...]을 클릭하여 표시된 대화 상자에서 OCR 설정을 조정합니다.
-
[확인]을 클릭합니다. [출력 옵션] 대화 상자에서 저장 위치와 출력 PDF 파일의 명명 방법을 지정합니다.
-
대상 폴더 출력 PDF를 원본과 동일한 폴더 또는 특정 폴더에 저장할 것인지 선택합니다.
-
파일 이름 지정 원래 파일 이름을 유지할지 또는 원래 파일 이름에 접두사/접미사를 추가시킬지 선택합 니다. 원래 파일 이름에 접두사/접미사를 추가하려면 [원래 파일 이름에 추가]를 선택한 다음 [다음 항목 앞에 삽입] 또는 [뒤에 삽입] 상자에 문자를 입력하여 출력 파일 이름이 “텍스트 삽입+원래 파일 이름+텍스트 삽입.pdf” 형식으로 되도록 지정합니다. [원래 파일 이름 유지]를 선택한 경우, [기존 파일 덮어쓰기] 확인란을 선택해야만 출력 PDF 파일이 원래 파일을 덮어씁니다.
-
[확인]을 클릭합니다.
OCR 서스펙트 찾기 및 수정
[추정 대상 찾기] 기능은 잠재적인 인식 오류를 발견하고 텍스트를 수정하기 위한 옵션을 제공합니다. 이 기능은 스캔한 문서를 검색 가능하게 만든 후에만 사용할 수 있습니다. 원본 문서가 선명할수록 서스펙트가 적게 나타납니다.
-
OCR을 실행할 스캔한 PDF 문서를 엽니다. 복사본을 만들고 복사본에서만 OCR을 실행합니다.
-
[고급] > [추정 대상 찾기]를 선택한 다음 필요에 따라 다음 옵션 중 하나를 선택합니다.
-
[요소 찾기] 대화 상자에서 [찾기]를 클릭하여 서스펙트를 강조 표시합니다. 서스펙트 텍스트가 페이지에서 강조 표시되는 동시에 [원본 문서] 상자(A)에 표시됩니다. 다음 옵션을 사용하여 서스펙트 작업을 수행할 수 있습니다.
-
[동의 및 찾기](B)를 클릭하여 해석이 정확함을 확인하고 다음 서스펙트로 이동합니다. OCR 엔진이 식별한 OCR 텍스트 필드에 표시된 텍스트가 올바르지 않은 경우, 새 텍스트를 입력하고 [동의 및 찾기]를 클릭하여 수정한 텍스트로 교체합니다.
-
[다음 찾기](C)를 클릭하여 다음 서스펙트로 이동합니다.
-
서스펙트가 텍스트로 올바르게 식별되지 않은 경우 [텍스트가 아님](D)을 클릭합니다.
참고: [추정 대상 찾기] 기능은 OCR을 수행할 때 [검색 가능]을 선택한 경우에만 사용할 수 있습니다. 텍스트를 검색 가능하게 만든 후 스캔한 원본 문서의 모양은 유지됩니다.
