OCR 엔진 선택

문서 유형을 기반으로 데이터 추출 요구 사항에 적합한 OCR 엔진을 선택할 수 있습니다. 엔진 변경을 구현하기 위해 IQ Bot 서비스를 재시작할 필요는 없습니다.

IQ Bot 설치하는 동안 시스템은 Tesseract Optical Character Reader의 최신 버전을 기본 OCR 엔진으로 설정합니다. 이는 제품의 기본 설정이기도 합니다. 그러나 기본 엔진이 되는 OCR 엔진을 Settings.txt 파일에서 수동으로 설정할 수 있습니다. IQ Bot의 이전 릴리스와 마찬가지로 기본값으로 설정할 OCR 엔진 이름으로 Settings.txt 파일을 수동으로 계속 업데이트할 수 있습니다.

학습 인스턴스를 생성할 때 광학 문자 인식 드롭다운 메뉴에서 OCR 엔진을 선택할 수 있습니다. 학습 인스턴스 생성 항목을 참조하십시오.
주:
  • 인터페이스에서 OCR 엔진을 선택하면 Settings.txt 파일의 설정이 재정의됩니다.
  • Tegaki API OCR에는 Automation 360 IQ Bot 클라우드에서 지원되지 않는 별도의 온프레미스 설정이 필요하므로 Tegaki API OCR을 제외한 다른 모든 OCR 엔진을 사용할 수 있습니다.

    Automation 360 IQ Bot 클라우드에서 지원되는 최신 버전의 OCR 엔진을 항상 사용할 수 있지만 특정 OCR 버전을 선택할 수는 없습니다.

다음 테이블에는 IQ Bot에서 지원되는 다양한 OCR 엔진 및 해당 옵션이 나열됩니다.

표 1. OCR 엔진 및 사양 목록
한정자 OCR 버전 지원되는 설치 필기 지원되는 언어 문서 품질 문서 유형
Tesseract OCR 4 클라우드온프레미스 해당 없음

영어

독일어

스페인어

이탈리아어

프랑스어

노이즈 없음

어두운 배경 없음

스탬프/워터마크 없음

200dpi 이상

송장, PO 등

반구조화 형식

ABBYY FineReader Engine 12.3 또는 12.4 클라우드온프레미스 해당 없음

영어

모든 라틴어+

Chinese

일본어

한국어

더 적은 노이즈

흰색 글꼴이 있는 어두운 배경

스탬프/워터마크 있음

96dpi 이상

송장, PO 등

반구조화 형식

모기지 양식, 세금 양식

비구조화 형식

Microsoft Azure Computer Vision OCR 엔진 2.0 또는 3.2 클라우드온프레미스 영어만

영어

모든 라틴어+

Chinese

일본어

한국어

더 적은 노이즈

어두운 배경

스탬프/워터마크 있음

96dpi 이상

송장, PO 등

반구조화 형식

여권, 운전면허증 등

KYC 문서

Google Vision API 현재 릴리스와 일치하도록 버전이 자동으로 업데이트됩니다. 클라우드온프레미스 해당 없음

영어

모든 라틴어+

아시아어

더 적은 노이즈

어두운 배경

스탬프/워터마크 있음

96dpi 이상

송장, PO 등

반구조화 형식

모기지 양식, 세금 양식

비구조화 형식

프로시저

  1. 새 학습 인스턴스 생성 페이지에서 문서의 도메인과 언어를 선택합니다.
    내 학습 인스턴스 목록 페이지에서 각 학습 인스턴스를 생성하는 데 사용되는 OCR 엔진을 보여주는 OCR 엔진 열을 사용할 수 있습니다. 이 정보는 문서 처리를 결정할 때 사용자에게 유용합니다.
  2. 도메인을 선택하면 추출할 필드고급 설정 섹션이 표시됩니다.
    각 도메인은 기본 지원 언어의 사전 정의된 목록과 함께 사용할 수 있습니다. 언어 선택은 특정 도메인에 대해 지원되는 언어를 기반으로 문서의 기본 언어 드롭다운 목록에서 활성화되고 사용할 수 있습니다.
    주: 문서의 기본 언어 드롭다운 목록에서 언어를 선택한 다음 해당 언어를 지원하지 않는 엔진을 선택하면 광학 문자 인식 드롭다운 목록에 오류 메시지가 표시됩니다.
  3. 고급 설정 > 광학 문자 인식을 클릭하여 OCR 엔진 옵션 드롭다운 목록을 표시합니다.

    OCR 엔진 선택이 유효하지 않은 경우, 인스턴스 생성 및 분석 옵션이 활성화되지 않습니다.

    주: IQ BotABBYY FineReader Engine를 제외한 모든 OCR 엔진을 설치 프로세스 중에 자동으로 설치합니다.
    중요사항: Automation 360 IQ Bot 온프레미스에서 선택한 OCR 엔진만 구성할 수 있습니다. Automation 360 IQ Bot 클라우드OCR 설정은 ABBYY FineReader Engine을 제외하고 액세스할 수 없으므로 편집할 수 없습니다. ABBYY FineReader EngineappConfigurations REST API를 사용하기 위한 구성 설정을 편집할 수 있습니다.

    다음 중에서 선택할 수 있습니다.

    옵션설명
    Tesseract OCR 4 이것은 Settings.txt 파일에서 변경하지 않는 한 기본 엔진입니다.
    ABBYY FineReader Engine

    시스템에 ABBYY FineReader Engine가 설치되어 있고 사용할 수 있는지 확인하려면 Settings.txt 파일, SDK 파일의 OCR 플러그인 폴더 및 광학 문자 인식 드롭다운 목록을 확인하십시오.

    주: IQ Bot [로컬 기기] 패키지IQ Bot Extraction 패키지에서도 지원됩니다.

    IQ Bot에서 ABBYY FineReader Engine OCR 엔진 사용

    Microsoft Azure Computer Vision OCR 엔진 IQ Bot은 이 OCR 엔진이 지원하는 모든 언어를 지원합니다.

    Microsoft Azure Computer Vision OCR 엔진 사용

    Google Vision API IQ BotOCR엔진으로 Google Vision API을 지원하고 엔진에서 지원하는 모든 언어를 지원합니다.

    Google Vision API OCR 엔진 사용

    내 PDF 문서에는 이미지가 없습니다

    업로드하는 모든 PDF 문서는 사용자가 지정하거나 선택한 OCR 엔진에 관계없이 기본적으로 PDFBox OCR을 사용하여 처리됩니다.

    이미지가 포함된 비 PDF 문서나 PDF 문서를 업로드하는 경우, 내 PDF 문서에 이미지가 없습니다 확인란의 선택을 취소하여 지정하거나 선택한 OCR 엔진이 문서를 처리하는 데 사용되는지 확인합니다.

    내 PDF 문서에는 이미지가 없습니다 확인란은 기본적으로 활성화되어 있습니다. 이 기능을 비활성화하려면 PDFBox 옵션 비활성화을(를) 참조하십시오.
    팁: IQ Bot이 저품질 또는 수기 문서에서 데이터를 추출할 수 없는 경우, 문제를 해결합니다.

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

    주: 다음 파일을 사용하여 OCR 설정 변경:
    • AbbyyImagePreProcessingSettings.json
    • LangugeCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    How to change OCR Settings in IQ Bot (A-People login required)