Google CDE를 사용하여 학습 인스턴스 생성

학습 인스턴스는 문서 유형, 언어 및 추출할 필드와 같은 정보를 가지는 구조입니다. 사용자 정의 추출기 프로세서를 생성한 후 문서에서 데이터를 추출하려면 학습 인스턴스를 생성해야 합니다.

전제 조건

  • Google CDE(Custom Document Extractor) 프로세서를 성공적으로 생성하고 교육했는지 확인합니다.
  • Control Room에 문서 워크스페이스(페이지 수) 제품 라이선스가 있는지 확인합니다.
  • BYOK를 구성했는지 확인합니다. 자세한 내용은 Google CDE용 BYOK 키 가져오기 구성 항목을 참조하십시오.

새 프로세서를 Google Document AI와 통합하기 위해 학습 인스턴스를 생성하는 것이 중요합니다. 여기에는 제공업체를 Google Document AI(사용자 정의) 옵션으로 활용하는 것이 포함됩니다. 이 옵션을 사용하여 학습 인스턴스를 생성하면 사용자는 프로세서 내 이름과 동일하게 양식 및 테이블 필드를 정의할 수 있습니다.
주:
  • 현재 Google Document AI는 단일 테이블 추출을 지원합니다.
  • 확인란 기능(미리보기 모드)은 확인란 필드에 일관되지 않은 추출을 야기하여 일관되지 않은 결과를 초래할 수 있습니다. 이러한 경우 시스템에서 확인란 필드 값을 정확하게 추출할 수 없으면 찾을 수 없음으로 라벨링됩니다.

프로시저

  1. Control Room 홈 페이지에서 관리 > 학습 인스턴스 > 학습 인스턴스 생성으로 이동합니다.
    학습 인스턴스 생성 창이 새 탭에서 열립니다.
  2. 생성할 새 학습 인스턴스의 이름을 추가합니다.
  3. 문서 유형 드롭다운 메뉴에서 사용자 정의를 선택합니다.
  4. 제공업체 메뉴에서 Google Document AI(사용자 정의)를 선택합니다.
  5. 테이블 또는 양식 필드를 선택합니다.
  6. Google CDE 프로세서에서 사용되는 것과 동일한 이름으로 새 필드를 만듭니다.
    주: 새 필드를 만들 경우 해당 필드의 이름이 Google 프로세서에서 사용되는 스키마 라벨과 일치하는지 확인합니다. 이 항목은 양식 필드와 테이블 필드에 적용됩니다.
  7. 생성을 클릭합니다.

    새 학습 인스턴스가 생성되면 Control Room자동화 > 문서 워크스페이스에 학습 인스턴스와 같은 이름의 폴더를 생성합니다.

  8. 학습 인스턴스의 추출 Bot을 서비스 계정 및 프로세서 엔드포인트 URL로 업데이트합니다.
    1. Bots > IQ Bot Processes > {LI name} > {LI name}_extractionbot에서 학습 인스턴스에 대한 Bot을 엽니다.
    2. 자격증명 저장소 라커와 키를 선택합니다. 자세한 내용은 Google CDE용 BYOK 키 가져오기 구성 항목을 참조하십시오.
    3. Google CDE 프로세서에서 예측 엔드포인트 URL을 복사합니다.
      Google Document AI의 예측 엔드포인트
    4. 복사한 URL을 문서 처리기용 Document AI 엔드포인트 URL에 붙여넣습니다.

      문서 프로세서용 Document AI 엔드포인트 URL

다음 단계

학습 인스턴스에 문서를 업로드하고, 유효성 검사 오류를 수정하고, 추출된 데이터를 확인합니다. 자세한 내용은 Document Automation에서 문서 처리 항목을 참조하십시오.