OCR (광학적 문자 인식) - 사용자 매뉴얼

Right PDF Pro (macOS)

제1장 시작하기
제2장 작업 영역
제3장 PDF 보기
제4장 PDF 작성
제5장 PDF 편집
제6장 검토 및 주석
- 주석 도구
- 공유 및 공동 작업
  - PDF 문서 공유
  - PDF에서 다른 사람들과 공동 작업
- 주석 관리
- 거리, 둘레길이 및 면적 측정
  - 측정 도구 사용
  - 측정 도구 속성 편집
제7장 문서 어셈블리
- 페이지 조작, 문서 분할 및 페이지 번호 매기기
- 페이지 축소판
  - 페이지 축소판 정보
  - 페이지 속성
- 모든 PDF 문서 병합
- 책갈피를 사용하여 탐색
- PDF 태그
- PDF 레이어
- PDF에 머리글, 바닥글 및 Bates 번호 매기기 추가
- PDF에 워터마크 추가
- 조판
- PDF에 링크 만들기
- 대상
- 일괄 처리
제8장 양식
제9장 보안
제10장 PDF 저장 및 내보내기
제11장 멀티미디어
제12장 검색 및 색인
- PDF 검색
- PDF 색인 작성

OCR (관학적 문자 인식)은 전자지 장치(예: 스캐너 또는 디지털 카메라)가 종이에 인쇄된 문자를 검사하고 어둡고 밝은 패턴을 감지하여 모양을 결정한 다음 문자 인식 방법을 사용하여 모양을 컴퓨터 텍스트로 변환하는 프로세스를 말합니다. 즉 이미지의 텍스트를 텍스트 형식으로 변환하는 프로세스입니다. OCR 기능을 사용하면 스캔한 문서의 텍스트를 검색 및 편집 가능하게 만들 수 있습니다.

현재 문서에서 OCR 실행

렌더링 가능한 텍스트(컴퓨터에서 생성된 텍스트가 이미지 레이어 위에 배치)가 포함된 페이지에서는 OCR을 수행할 수 없습니다.

Right PDF macOS에서 OCR을 실행할 PDF 문서를 엽니다.
[고급] > [OCR]를 선택하고 [현재 파일]을 선택합니다.
[OCR 텍스트 인식] 대화 상자에서 필요에 따라 OCR 설정을 조정합니다.
- 페이지 범위 모든 페이지, 현재 페이지 또는 선택한 페이지를 인식하도록 선택합니다.
- 페이지 기울기 자동 보정 이 확인란을 선택하면 Right PDF macOS가 자동으로 페이지 방향을 조정합니다.
- PDF 유형 출력 PDF 유형을 선택합니다.
  - 검색 가능 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
  - 검색 및 편집 가능 텍스트 이미지를 검색 및 편집 가능한 텍스트로 변환합니다.
  - MRC PDF 문서 MRC를 사용하여 이미지를 압축합니다.
  - 검색 가능한 MRC MRC를 사용하여 이미지를 압축하고 텍스트 이미지를 검색 가능한 텍스트로 변환합니다.
- MRC 압축 압축 수준을 설정합니다. 압축 수준이 높을수록 파일 크기는 작아지고 품질은 떨어집니다. MRC는 텍스트 요소를 이미지 또는 배경과 분리하고 각 요소에 최적의 압축을 적용합니다.
- 인식할 언어 문자를 식별하는데 사용할 OCR 엔진의 언어를 선택합니다. 최적의 OCR 결과를 얻으려면 [인식할 언어] 목록에서 문서에 포함된 언어만 선택합니다. 여러 언어를 선택할 때 다음과 같은 제한 사항이 있습니다.
  - 아시아 언어를 하나만 선택하거나 라틴 문자 또는 키릴 문자를 사용하는 언어를 하나 이상 선택합니다.
  - 아시아 언어는 다른 언어와 혼합할 수 없습니다.
    참고: 문서가 이러한 제한을 초과하는 경우, [자동 언어 감지] 확인란을 선택합니다.
- 자동 언어 감지 이 확인란을 선택하면 Right PDF는 각 페이지에 적합한 언어를 감지하고 적용합니다.
[확인]을 클릭합니다.

여러 파일에서 OCR 실행

[고급] > [OCR]를 선택하고 [여러 파일]을 선택합니다.
[OCR 텍스트 인식] 대화 상자에서 OCR을 실행할 파일을 찾아 선택하고 [확인]을 클릭합니다.
- 파일 추가...목록에 하나 이상의 파일을 추가합니다. Command 키를 누른 채 클릭하여 여러 파일을 선택합니다.
- 폴더 추가... 폴더를 선택하고 [선택]을 클릭합니다. 선택된 폴더 내의 모든 파일이 파일 목록에 추가됩니다.
- 제거 파일을 하나 선택하거나 Command 키를 누른 채 클릭하여 여러 파일을 선택한 다음 [제거]를 클릭합니다. 선택된 파일이 목록에서 제거됩니다.
- 현재 열린 파일을 포함 파일 목록에 현재 열려 있는 모든 PDF 파일을 포함하려면 이 확인란을 선택합니다.
[설정...]을 클릭하여 표시된 대화 상자에서 OCR 설정을 조정합니다.
[확인]을 클릭합니다. [출력 옵션] 대화 상자에서 저장 위치와 출력 PDF 파일의 명명 방법을 지정합니다.
- 대상 폴더 출력 PDF를 원본과 동일한 폴더 또는 특정 폴더에 저장할 것인지 선택합니다.
- 파일 이름 지정 원래 파일 이름을 유지할지 또는 원래 파일 이름에 접두사/접미사를 추가시킬지 선택합 니다. 원래 파일 이름에 접두사/접미사를 추가하려면 [원래 파일 이름에 추가]를 선택한 다음 [다음 항목 앞에 삽입] 또는 [뒤에 삽입] 상자에 문자를 입력하여 출력 파일 이름이 “텍스트 삽입＋원래 파일 이름＋텍스트 삽입.pdf” 형식으로 되도록 지정합니다. [원래 파일 이름 유지]를 선택한 경우, [기존 파일 덮어쓰기] 확인란을 선택해야만 출력 PDF 파일이 원래 파일을 덮어씁니다.
[확인]을 클릭합니다.

OCR 서스펙트 찾기 및 수정

[추정 대상 찾기] 기능은 잠재적인 인식 오류를 발견하고 텍스트를 수정하기 위한 옵션을 제공합니다. 이 기능은 스캔한 문서를 검색 가능하게 만든 후에만 사용할 수 있습니다. 원본 문서가 선명할수록 서스펙트가 적게 나타납니다.

OCR을 실행할 스캔한 PDF 문서를 엽니다. 복사본을 만들고 복사본에서만 OCR을 실행합니다.
[고급] > [추정 대상 찾기]를 선택한 다음 필요에 따라 다음 옵션 중 하나를 선택합니다.
- 첫 번째 OCR 추정 대상 첫 번째 서스펙트 단어를 식별합니다. [요소 찾기] 대화 상자에서 [찾기] 단추를 클릭하면 첫 번째 서스펙트가 강조 표시됩니다.
- 모든 OCR 추정 대상 모든 서스펙트 단어를 강조 표시합니다. 서스펙트 단어를 두 번 클릭하고 표시된 [요소 찾기] 대화 상자에서 해당 서스펙트를 수정할 수 있습니다.
[요소 찾기] 대화 상자에서 [찾기]를 클릭하여 서스펙트를 강조 표시합니다. 서스펙트 텍스트가 페이지에서 강조 표시되는 동시에 [원본 문서] 상자(Ａ)에 표시됩니다. 다음 옵션을 사용하여 서스펙트 작업을 수행할 수 있습니다.
- [동의 및 찾기](Ｂ)를 클릭하여 해석이 정확함을 확인하고 다음 서스펙트로 이동합니다. OCR 엔진이 식별한 OCR 텍스트 필드에 표시된 텍스트가 올바르지 않은 경우, 새 텍스트를 입력하고 [동의 및 찾기]를 클릭하여 수정한 텍스트로 교체합니다.
- [다음 찾기](Ｃ)를 클릭하여 다음 서스펙트로 이동합니다.
- 서스펙트가 텍스트로 올바르게 식별되지 않은 경우 [텍스트가 아님](Ｄ)을 클릭합니다.

참고: [추정 대상 찾기] 기능은 OCR을 수행할 때 [검색 가능]을 선택한 경우에만 사용할 수 있습니다. 텍스트를 검색 가능하게 만든 후 스캔한 원본 문서의 모양은 유지됩니다.

다음 : 파일을 PDF로 변환

기타 리소스