Google Vision API OCR 엔진 사용

IQ Bot이 있는 Google Vision API OCR 엔진을 사용하여 아시아 언어, 특히 일본어와 한국어로 된 트레이닝 문서에 대한 광학 문자 인식(OCR) 결과의 정확성을 개선합니다. IQ BotGoogle Vision API OCR 엔진은 엔진이 지원하는 모든 언어를 지원합니다.

전제 조건

TCP를 사용하여 API 엔드포인트에 대한 통신이 가능하도록 기본 포트 443을 사용할 수 있는지 확인합니다.

주: 아래 예제 섹션에서 Google Vision API의 사용에 허용된 서비스 URL 목록을 참조하십시오.
Google Vision API 파일은 IQ Bot 설치 중에 자동으로 컴퓨터에 설치되며, 단일 단계 설치와 함께 기본 제공 플러그인으로 제공되며, 모든 사용자가 사용할 수 있습니다.
  • 이는 클라우드 OCR 엔진입니다.
  • Google Vision API은 하나 이상의 언어가 포함된 문서를 지원하지 않습니다. 이 기능을 사용하기 전에 주로 일본어 또는 한국어 텍스트만 추출해야 합니다.
  • 왼쪽에서 오른쪽으로 쓰는 대신 오른쪽에서 왼쪽으로 쓰는 언어는 IQ Bot에서 문서 추출에 대해 지원되지 않습니다. 아랍어, 아람어, 아제르어, 디베히어, 풀라어, 히브리어, 쿠르드어, 코어, 페르시아어, 로힝야어, 시리아어 및 우르두어.

    이번 릴리스 이전에 엔진은 주로 일본어 및 한국어 텍스트에 대해서만 데이터 추출을 지원했습니다.

    Automation 360 IQ Bot에서 지원되는 언어

  • 데이터는 Google Cloud에 저장되지 않으며 즉시 제거됩니다.

    데이터 보존을 위한 개인정보 보호에 대한 추가 정보는 Google Data Usage을 참조하십시오.

IQ BotGoogle Vision API OCR 엔진 사용 라이선스를 제공합니다. 자신의 라이선스 키를 사용할 수도 있습니다.

Google Vision API OCR 엔진에 자체 라이선스 키 사용

주: OCR 엔진 개선, 향상 및 버그 수정과 같은 Google Vision API 업데이트는 IQ Bot에서 OCR 엔진을 사용할 때 콘텐츠 추출에 영향을 미칠 수 있습니다. 따라서 주기적으로 Google Vision API 릴리스 정보에서 최신 업데이트를 참조하는 것이 좋습니다.

Google Vision API OCR 업그레이드의 잠재적 영향 항목을 참조하십시오.

OCR 엔진을 사용할 수 있는 옵션은 다음과 같습니다.
옵션 설명
옵션 1: 기본 엔진을 Google Vision API으로 설정 Settings.txt 파일을 구성합니다.
제한사항: settings.txt 파일 구성은 Automation 360 IQ Bot 클라우드에 적용되지 않습니다.
옵션 2: 학습 인스턴스를 생성할 때 UI에서 직접 Google Vision API 엔진 선택 OCR 엔진 선택

프로시저

Google Vision API을 기본 OCR 엔진으로 설정하려면 Settings.txt 파일을 다음과 같이 구성합니다.

제한사항: settings.txt 파일 구성은 Automation 360 IQ Bot 클라우드에 적용되지 않습니다.

  1. IQ Bot 설치 프로그램을 실행합니다.
  2. 옵션: Google Vision API을 새 학습 인스턴스에 대한 기본 OCR로 설정합니다.
    ..\Automation 360 IQ Bot\Configurations\Settings.txt로 이동하여 다음 값을 수정합니다. OCREngine=GoogleVisionAPI.
    이렇게 하면 Google Vision API OCR 엔진이 환경에 대한 기본 엔진으로 설정됩니다.
  3. GoogleOCREngineSettings.json 파일이 ..\Automation 360 IQ Bot\Configurations 폴더 내에서 다음과 같은 기본값을 포함하여 생성됩니다.
    다음 새 Google Vision API을 사용하십시오.
    {
      "ADCJson": null,
      "EngineType": 2,
      "EnableFieldMerging": true,
      "EnableFieldRegions": true,
      "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google"
     }
  4. 일본어 및 한국어 문서의 경우, 필드를 업데이트합니다. "EnableCustomParse": true.
    주: 변경한 후에는 서비스를 다시 시작할 필요가 없습니다.
Google Vision API에 사용되는 서비스 URL 목록(선택 사항)
필요한 경우 허용되는 다음 URL을 사용합니다.
주: 모든 URL은 미국의 글로벌 서비스 지역을 가리킵니다.
  • API URL: https://vision.googleapis.com/
  • 인증 URL: https://accounts.google.com/o/oauth2/auth
  • 토큰 URL: https://oauth2.googleapis.com/token
  • 인증 제공자 URL: https://www.googleapis.com/oauth2/v1/certs
  • 클라이언트 인증 URL: https://www.googleapis.com/robot/v1/metadata/x509

다음 단계

  1. 트레이닝하고자 하는 아시아 언어 문서로 새 학습 인스턴스를 생성합니다.
  2. 문서를 트레이닝하고 학습 인스턴스를 프로덕션으로 설정합니다.
  3. 아시아 언어 파일을 업로드하고 Bot을 실행합니다.
  4. 추출 결과의 정확도를 다운로드하여 봅니다.