학습 인스턴스는 문서 유형, 언어 및 추출할 필드와 같은 정보를 가지는 구조입니다. Standard Forms 생성 후 문서에서 데이터를 추출하려면 학습 인스턴스를 생성해야 합니다.

전제 조건

  • Standard Forms 구성이 완료되었는지 확인합니다.
  • Control RoomDocument Automation Standard Forms(페이지 수) 제품 라이선스가 있는지 확인하십시오.

프로시저

  1. Control Room 홈 페이지에서 AI > Document Automation > 새로 만들기로 이동합니다.
    학습 인스턴스 생성 창이 새 탭에서 열립니다.
  2. 생성할 새 학습 인스턴스의 이름을 추가합니다.
  3. 문서 유형 드롭다운 메뉴에서 표준 양식을 선택합니다.
    문서 유형으로서의 표준 양식
    주: 기본적으로 공급자 이름이 Microsoft Form Recognizer로 선택됩니다.
  4. 모델 선택을 위해 찾아보기를 클릭하고 이름 또는 설명 필터를 사용하여 모델을 검색합니다.
  5. 모델을 선택하고 선택을 클릭합니다.
  6. 문서 처리 방식 섹션에서 다음 옵션 중 하나를 선택합니다.
    • Task Bot 이 옵션은 기본적으로 선택됩니다. Bot Runners를 사용하여 데이터 추출을 수행합니다.
    • 클라우드 추출: Cloud Extraction Service를 사용하여 데이터 추출을 수행합니다.
      주: 클라우드 추출을 사용하려면 Enterprise Platform 라이선스와 Document AI Credits를 함께 구입해야 합니다.

    Task Bot클라우드 추출의 차이점을 이해하려면 Cloud Extraction Service 항목을 참조하십시오.

  7. 다음을 클릭합니다.
  8. 계속 진행하려면 다음 중 하나 이상의 필드를 선택해야 합니다.
    • 테이블
    • 양식

    양식 필드 또는 테이블 필드 중에서 선택
    주:
    • 신경 모델의 경우 테이블 필드가 자동으로 업데이트되지 않으므로 {table_name}: {field_name} 형식을 사용하여 테이블 필드를 수동으로 추가해야 합니다.
    • 신경 모델의 경우 표준 양식이 여러 테이블을 지원하며, 테이블은 테이블 탭 아래에 테이블 이름: 필드 이름으로 표시됩니다.
  9. 일부 다른 필드 속성은 다음과 같습니다.
    옵션설명
    필드 이름 알파벳 문자(A~Z 또는 a~z)로 시작하는 필드 이름을 입력합니다.

    표준 필드에서 필드 이름은 하드 코딩되어 있으며 변경할 수 없습니다.

    필드 라벨 유효성 검사기를 돕기 위해 사용자에게 친숙한 이름을 입력합니다.

    예를 들어 조직 세금 번호VAT 번호와 같은 지역화된 이름으로 바꿀 수 있습니다.

    필드 라벨은 추출에 영향을 미치지 않습니다.

    신뢰도 잠재적인 오탐률을 줄이기 위해 임계값을 설정합니다.

    처리 시 Document Automation 엔진은 데이터가 올바르게 추출되었다는 확실성을 나타내기 위해 문서의 각 필드에 점수를 부여합니다. 문서에 신뢰 임계값보다 낮은 점수가 있는 필드가 있는 경우 해당 문서는 유효성 검사 대기열로 전송됩니다.

    높은 신뢰 임계값을 입력하면 더 많은 문서가 유효성 검사 대기열로 보내집니다. 낮은 신뢰도 임계값을 입력하면 유효성 검사 대기열로 전송되는 문서가 줄어듭니다.

    0에서 100까지의 값을 지원합니다.

    데이터 유형 다음 데이터 유형 중에서 선택하십시오.
    • 주소*: 문서에서 주소 필드를 추출해야 할 때 이 데이터 유형을 사용합니다. 이 시스템은 다양한 주소 필드를 추출하도록 학습되었으며, 이 데이터 유형을 사용하면 시스템이 문서에서 주소를 감지하고 추출하도록 할 수 있습니다.
    • 텍스트: 문서에서 텍스트 필드를 추출해야 할 때 이 데이터 유형을 사용합니다. 이 시스템은 다양한 텍스트 필드를 추출하도록 학습되었으며, 이 데이터 유형을 사용하면 시스템이 문서에서 텍스트를 감지하고 추출하도록 할 수 있습니다.
    • 숫자: 문서에서 숫자 필드를 추출해야 할 때 이 데이터 유형을 사용합니다. 이 시스템은 다양한 숫자 필드를 추출하도록 학습되었으며, 이 데이터 유형을 사용하면 시스템이 문서에서 숫자를 감지하고 추출하도록 할 수 있습니다.
    • 날짜: 문서에서 날짜 필드를 추출해야 할 때 이 데이터 유형을 사용합니다. 이 시스템은 다양한 날짜 형식을 추출하도록 학습되었으며, 이 데이터 유형을 사용하면 시스템이 문서에서 날짜를 감지하고 추출하도록 할 수 있습니다.
    • 확인란: 이 데이터 유형은 확인란이 선택되었는지, 선택 해제되었는지 또는 찾을 수 없는지 확인해야 할 때 사용합니다.
    • 서명: 문서에서 서명을 검증해야 할 때 이 데이터 유형을 사용합니다. 이 데이터 유형은 고객이 은행에 발행한 수표와 같이 서명이 문서에 포함되어 있는지 확인해야 하는 상황에서 사용할 수 있습니다.
      주: 모델에서 서명 감지를 훈련할 때, 서명 객체를 클릭하는 대신 리전 옵션을 사용하여 서명에 대한 영역을 표시하도록 하십시오.

    필드의 데이터가 데이터 유형과 일치하지 않으면 문서가 유효성 검사 대기열로 보내집니다.

    Document Automation은 날짜 및 숫자 형식 변형을 지원합니다.

    * 사용자 정의 문서 유형으로 학습 인스턴스를 구성하는 경우, 양식 필드에는 주소의 전체 구조를 추출하는 주소 데이터 유형이 포함됩니다.

    필수 다음 중 하나를 선택합니다.
    • 필수 사항: 필드는 비워둘 수 없습니다.
    • 선택 사항: 필드가 비어 있거나 문서에 존재하지 않을 수 있습니다.
    유효성 검사 규칙 데이터 유형에 따라 패턴, 수식, 목록 및 문(예: 다음으로 시작 또는 다음으로 종료)을 사용하여 규칙을 만듭니다.

    Starts With 및 Ends With | 패턴 | 목록 | 수식

  10. 생성을 클릭합니다.
새 학습 인스턴스가 생성되면 Control Room자동화 > 문서 워크스페이스 폴더에 학습 인스턴스와 같은 이름의 폴더를 생성합니다. 이 폴더에는 두 개의 bots(추출 및 다운로드), 프로세스 및 양식이 포함됩니다.학습 인스턴스 자산의 예시 스크린샷
  • 프로세스: 업로드된 문서에서 Document Automation 데이터를 추출하고, 유효성 검사를 위해 사용자에게 문서를 할당하고, 추출된 데이터를 다운로드하는 IF/Else 시나리오를 사용하여 프로세스를 관리합니다. 자세한 내용은 Document Automation의 Automation Co-Pilot for Business Users 프로세스 항목을 참조하십시오.
  • Extraction Bot: 업로드된 문서의 정의된 필드에서 데이터를 추출합니다.
  • 다운로드 Bot: 추출된 데이터를 기기 또는 공유 네트워크의 특정 폴더로 다운로드합니다.
  • 양식: 프로세스로 전송되는 입력 매개 변수를 정의합니다. 입력 매개 변수에는 학습 인스턴스 이름, 업로드된 파일 및 출력 파일 경로가 포함됩니다.

다음 단계

학습 인스턴스에 문서를 업로드하고, 유효성 검사 오류를 수정하고, 추출된 데이터를 확인합니다. Document Automation에서 문서 처리