OCR 엔진 선택

UI에서 다른 OCR 엔진을 선택하여 문서 유형에 따라 데이터 추출 요구 사항에 가장 적합한 엔진이 무엇인지 확인할 수 있습니다. 엔진 변경을 구현하기 위해 IQ Bot 서비스를 중지하고 다시 시작할 필요는 없습니다.

IQ Bot 설치하는 동안 시스템은 의 최신 버전을 기본 Tesseract Optical Character Reader 엔진OCR으로 설정합니다. 이는 제품의 글로벌 설정이기도 합니다.

그러나 기본 OCR 엔진이 되는 Settings.txt 파일에서 엔진을 수동으로 설정할 수 있습니다. 의 이전 릴리스와 마찬가지로, 기본값으로 설정할 IQ Bot 엔진 이름으로 Settings.txt 파일을 수동으로 계속 업데이트할 OCR수 있습니다.

OCRSettings.txt 파일 구성을 통해 사용되지 않는 엔진 또는 지원되지 않는 엔진을 선택하면 오류 메시지가 표시됩니다.

학습 인스턴스를 생성할 때 UI에서 직접 사용할 수 있는 드롭다운 목록에서 OCR 엔진을 선택할 수 있습니다.
주: 인터페이스에서 OCR 엔진을 선택하면 Settings.txt 파일의 설정이 무시됩니다.

학습 인스턴스 생성

프로시저

  1. 새 학습 인스턴스 만들기 페이지에서 문서의 도메인과 언어를 선택합니다.
    내 학습 인스턴스 목록 페이지에서 각 학습 인스턴스를 생성하는 데 사용되는 엔진을 보여주는 새 OCR 엔진OCR 열을 사용할 수 있습니다. 이 정보는 문서 처리를 결정할 때 사용자에게 유용합니다.
  2. 도메인을 선택하면 추출필드 및 고급 설정 섹션이 표시됩니다.
    각 도메인은 기본 지원 언어의 사전 정의된 목록과 함께 사용할 수 있습니다. 언어 선택은 특정 도메인에 대해 지원되는 언어에 따라 문서의 기본 언어 드롭다운 목록에서 사용할 수 있습니다.
    주: 문서의 기본 언어 드롭다운 목록에서 언어를 선택한 다음 해당 언어를 지원하지 않는 엔진을 선택하면 광학 문자 인식 드롭다운 목록에 오류 메시지가 표시됩니다.
  3. 고급 설정 > 광학 문자 인식을 클릭하여 OCR 엔진 옵션 드롭다운 목록을 표시합니다.

    OCR 엔진 선택이 유효하지 않은 경우 인스턴스 생성 및 분석 옵션이 활성화되지 않습니다.

    주: IQ Bot 는 를 제외한 모든 OCR 엔진을 설치 프로세스 중에 자동으로 설치합니다ABBYY FineReader Engine.
    중요사항: 에서 선택한 OCR 엔진만 구성할 수 있습니다Automation 360 IQ Bot. On-PremisesOCR 설정은 액세스할 수 없으므로 편집할 Automation 360 IQ Bot Cloud 수 없습니다.

    다음 중에서 선택할 수 있습니다.

    옵션 설명
    Tesseract OCR4 이것은 Settings.txt 파일에서 변경하지 않는 한 기본 엔진입니다. IQ Bot Version 11.3.5 이후 버전에서는 Tesseract4 OCR 이후 버전만 선택할 수 있습니다.
    ABBYY FineReader Engine 이 플러그인은 설치 중에 자동으로 설치되지 않습니다. 다음 단계에 따라 이 OCR 엔진을 다운로드하십시오. 에 ABBYY FineReader Engine OCR 엔진 설치 IQ Bot

    ABBYY FineReader Engine 설치되어 있고 사용할 수 있는지 확인하려면 Settings.txt 파일, SDK 파일의 OCR 플러그인 폴더 및 Optical 문자 인식 드롭다운 목록을 확인하십시오.

    Microsoft Azure Computer Vision OCR engine IQ Bot Version 11.3.5 는 이 엔진에서 지원하는 모든 언어를 지원합니다.

    사용 Microsoft Azure Computer Vision OCR engine

    Google Vision API IQ Bot Version 11.3.5Google Vision API 엔진OCR으로 를 지원하고 엔진에서 지원하는 모든 언어를 지원합니다. 이번 출시 이전에 엔진은 주로 일본어 및 한국어 텍스트에 대해서만 데이터 추출을 지원했습니다.

    Google Vision API OCR 엔진 사용

    (베타) Tegaki API IQ Bot Version 11.3.5 는 이 OCR 엔진의 베타 버전을 지원하여 일본어 및 한국어 문서에 대한 데이터를 추출합니다. 사용자는 을(를) 사용하려면 개인 라이선스를 다운로드하여 사용해야 합니다Tegaki API.

    Tegaki API OCR 엔진 사용

    내 PDF 문서에 이미지가 없습니다. 확인란 내 PDF 문서에 이미지가 없습니다. 확인란은 기본적으로 활성화되어 있습니다. 사용자는 이를 비활성화할 수 있습니다.

    PDFBox 옵션 비활성화

    팁: IQ Bot 가 낮은 품질 또는 손으로 쓴 문서에서 데이터를 추출할 수 없는 경우 문제를 해결합니다.

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)