OCR (관학적 문자 인식)은 전자지 장치(예: 스캐너 또는 디지털 카메라)가 종이에 인쇄된 문자를 검사하고 어둡고 밝은 패턴을 감지하여 모양을 결정한 다음 문자 인식 방법을 사용하여 모양을 컴퓨터 텍스트로 변환하는 프로세스를 말합니다. 즉 이미지의 텍스트를 텍스트 형식으로 변환하는 프로세스입니다. OCR 기능을 사용하면 스캔한 문서의 텍스트를 검색 및 편집 가능하게 만들 수 있습니다.


현재 문서에서 OCR 실행

렌더링 가능한 텍스트(컴퓨터에서 생성된 텍스트가 이미지 레이어 위에 배치)가 포함된 페이지에서는 OCR을 수행할 수 없습니다.

  1. Right PDF macOS에서 OCR을 실행할 PDF 문서를 엽니다.

  2. [고급] > [OCR]를 선택하고 [현재 파일]을 선택합니다.

  3. [OCR 텍스트 인식] 대화 상자에서 필요에 따라 OCR 설정을 조정합니다.

    • 페이지 범위  모든 페이지, 현재 페이지 또는 선택한 페이지를 인식하도록 선택합니다.

    • 페이지 기울기 자동 보정  이 확인란을 선택하면 Right PDF macOS가 자동으로 페이지 방향을 조정합니다.

    • PDF 유형  출력 PDF 유형을 선택합니다.

      • 검색 가능  텍스트 이미지를 검색 가능한 텍스트로 변환합니다.

      • 검색 및 편집 가능  텍스트 이미지를 검색 및 편집 가능한 텍스트로 변환합니다.

      • MRC PDF 문서  MRC를 사용하여 이미지를 압축합니다.

      • 검색 가능한 MRC  MRC를 사용하여 이미지를 압축하고 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.

    • MRC 압축  압축 수준을 설정합니다. 압축 수준이 높을수록 파일 크기는 작아지고 품질은 떨어집니다. MRC는 텍스트 요소를 이미지 또는 배경과 분리하고 각 요소에 최적의 압축을 적용합니다.

    • 인식할 언어  문자를 식별하는데 사용할 OCR 엔진의 언어를 선택합니다. 최적의 OCR 결과를 얻으려면 [인식할 언어] 목록에서 문서에 포함된 언어만 선택합니다. 여러 언어를 선택할 때 다음과 같은 제한 사항이 있습니다.

      • 아시아 언어를 하나만 선택하거나 라틴 문자 또는 키릴 문자를 사용하는 언어를 하나 이상 선택합니다.

      • 아시아 언어는 다른 언어와 혼합할 수 없습니다.
        참고: 문서가 이러한 제한을 초과하는 경우, [자동 언어 감지] 확인란을 선택합니다.

    • 자동 언어 감지  이 확인란을 선택하면 Right PDF는 각 페이지에 적합한 언어를 감지하고 적용합니다.

  4. [확인]을 클릭합니다.


여러 파일에서 OCR 실행

  1. [고급] > [OCR]를 선택하고 [여러 파일]을 선택합니다.

  2. [OCR 텍스트 인식] 대화 상자에서 OCR을 실행할 파일을 찾아 선택하고 [확인]을 클릭합니다.

    • 파일 추가...목록에 하나 이상의 파일을 추가합니다. Command 키를 누른 채 클릭하여 여러 파일을 선택합니다.

    • 폴더 추가...  폴더를 선택하고 [선택]을 클릭합니다. 선택된 폴더 내의 모든 파일이 파일 목록에 추가됩니다.

    • 제거  파일을 하나 선택하거나 Command  키를 누른 채 클릭하여 여러 파일을 선택한 다음 [제거]를 클릭합니다. 선택된 파일이 목록에서 제거됩니다.

    • 현재 열린 파일을 포함  파일 목록에 현재 열려 있는 모든 PDF 파일을 포함하려면 이 확인란을 선택합니다.

  3. [설정...]을 클릭하여 표시된 대화 상자에서 OCR 설정을 조정합니다.

  4. [확인]을 클릭합니다. [출력 옵션] 대화 상자에서 저장 위치와 출력 PDF 파일의 명명 방법을 지정합니다.

    • 대상 폴더  출력 PDF를 원본과 동일한 폴더 또는 특정 폴더에 저장할 것인지 선택합니다.

    • 파일 이름 지정  원래 파일 이름을 유지할지 또는 원래 파일 이름에 접두사/접미사를 추가시킬지 선택합 니다. 원래 파일 이름에 접두사/접미사를 추가하려면 [원래 파일 이름에 추가]를 선택한 다음 [다음 항목 앞에 삽입] 또는 [뒤에 삽입] 상자에 문자를 입력하여 출력 파일 이름이 “텍스트 삽입+원래 파일 이름+텍스트 삽입.pdf” 형식으로 되도록 지정합니다. [원래 파일 이름 유지]를 선택한 경우, [기존 파일 덮어쓰기] 확인란을 선택해야만 출력 PDF 파일이 원래 파일을 덮어씁니다.

  5. [확인]을 클릭합니다.


OCR 서스펙트 찾기 및 수정

[추정 대상 찾기] 기능은 잠재적인 인식 오류를 발견하고 텍스트를 수정하기 위한 옵션을 제공합니다. 이 기능은 스캔한 문서를 검색 가능하게 만든 후에만 사용할 수 있습니다. 원본 문서가 선명할수록 서스펙트가 적게 나타납니다.

  1. OCR을 실행할 스캔한 PDF 문서를 엽니다. 복사본을 만들고 복사본에서만 OCR을 실행합니다.

  2. [고급] > [추정 대상 찾기]를 선택한 다음 필요에 따라 다음 옵션 중 하나를 선택합니다.

    • 첫 번째 OCR 추정 대상  첫 번째 서스펙트 단어를 식별합니다. [요소 찾기] 대화 상자에서 [찾기] 단추를 클릭하면 첫 번째 서스펙트가 강조 표시됩니다.

    • 모든 OCR 추정 대상  모든 서스펙트 단어를 강조 표시합니다. 서스펙트 단어를 두 번 클릭하고 표시된 [요소 찾기] 대화 상자에서 해당 서스펙트를 수정할 수 있습니다.

  3. [요소 찾기] 대화 상자에서 [찾기]를 클릭하여 서스펙트를 강조 표시합니다. 서스펙트 텍스트가 페이지에서 강조 표시되는 동시에 [원본 문서] 상자(A)에 표시됩니다. 다음 옵션을 사용하여 서스펙트 작업을 수행할 수 있습니다.

    • [동의 및 찾기](B)를 클릭하여 해석이 정확함을 확인하고 다음 서스펙트로 이동합니다. OCR 엔진이 식별한 OCR 텍스트 필드에 표시된 텍스트가 올바르지 않은 경우, 새 텍스트를 입력하고 [동의 및 찾기]를 클릭하여 수정한 텍스트로 교체합니다.

    • [다음 찾기](C)를 클릭하여 다음 서스펙트로 이동합니다.

    • 서스펙트가 텍스트로 올바르게 식별되지 않은 경우 [텍스트가 아님](D)을 클릭합니다.

참고: [추정 대상 찾기] 기능은 OCR을 수행할 때 [검색 가능]을 선택한 경우에만 사용할 수 있습니다. 텍스트를 검색 가능하게 만든 후 스캔한 원본 문서의 모양은 유지됩니다.