표준 양식에 대한 학습 인스턴스 생성

학습 인스턴스는 문서 유형, 언어 및 추출할 필드와 같은 정보를 가지는 구조입니다. 표준 양식 생성 후 문서에서 데이터를 추출하려면 학습 인스턴스를 생성해야 합니다.

전제 조건

  • 표준 양식 구성이 완료되었는지 확인합니다.
  • Control RoomDocument Automation 표준 양식(페이지 수) 제품 라이선스가 있는지 확인하십시오.

프로시저

  1. Control Room 홈 페이지에서 AI > Document Automation > 학습 인스턴스 생성으로 이동합니다.
    학습 인스턴스 생성이 오른쪽 상단 모서리에 나타납니다.
    학습 인스턴스 생성 창이 새 탭에서 열립니다.
  2. 생성할 새 학습 인스턴스의 이름을 추가합니다.
  3. 문서 유형 드롭다운 메뉴에서 표준 양식을 선택합니다.
    문서 유형으로서의 표준 양식
    주: 기본적으로 공급자 이름이 Microsoft Form Recognizer로 선택됩니다.
  4. 모델 선택을 위해 찾아보기를 클릭하고 이름 또는 설명 필터를 사용하여 모델을 검색합니다.
  5. 모델을 선택하고 다음을 클릭합니다.
  6. 계속 진행하려면 다음 중 하나 이상의 필드를 선택해야 합니다.
    • 테이블
    • 양식

    양식 필드 또는 테이블 필드 중에서 선택
    주:
    • 신경 모델의 경우 테이블 필드가 자동으로 업데이트되지 않으므로 {table_name}: {field_name} 형식을 사용하여 테이블 필드를 수동으로 추가해야 합니다.
    • 신경 모델의 경우 표준 양식이 여러 테이블을 지원하며, 테이블은 테이블 탭 아래에 테이블 이름:필드 이름으로 표시됩니다.
  7. 일부 다른 필드 속성은 다음과 같습니다.
    옵션설명
    필드 이름 알파벳 문자(A~Z 또는 a~z)로 시작하는 필드 이름을 입력합니다.

    표준 필드에서 필드 이름은 하드 코딩되어 있으며 변경할 수 없습니다.

    필드 라벨 유효성 검사기를 돕기 위해 사용자에게 친숙한 이름을 입력합니다.

    예를 들어 조직 세금 번호VAT 번호와 같은 지역화된 이름으로 바꿀 수 있습니다.

    필드 라벨은 추출에 영향을 미치지 않습니다.

    신뢰도 잠재적인 오탐률을 줄이기 위해 임계값을 설정합니다.

    처리 시 Document Automation 엔진은 데이터가 올바르게 추출되었다는 확실성을 나타내기 위해 문서의 각 필드에 점수를 부여합니다. 문서에 신뢰 임계값보다 낮은 점수가 있는 필드가 있는 경우 해당 문서는 유효성 검사 대기열로 전송됩니다.

    높은 신뢰 임계값을 입력하면 더 많은 문서가 유효성 검사 대기열로 보내집니다. 낮은 신뢰도 임계값을 입력하면 유효성 검사 대기열로 전송되는 문서가 줄어듭니다.

    0에서 100까지의 값을 지원합니다.

    데이터 유형 주소*, 텍스트, 숫자, 날짜 중에서 선택합니다.

    필드의 데이터가 데이터 유형과 일치하지 않으면 문서가 유효성 검사 대기열로 보내집니다.

    Document Automation은 날짜 형식 변형을 지원합니다.
    주: 사용자 정의 문서 유형으로 학습 인스턴스를 구성하는 경우, 양식 필드에는 주소의 전체 구조를 추출하는 주소 데이터 유형이 포함됩니다.
    필수 다음 중 하나를 선택합니다.
    • 필수 사항: 필드는 비워둘 수 없습니다.
    • 선택 사항: 필드가 비어 있거나 문서에 존재하지 않을 수 있습니다.
    유효성 검사 규칙 데이터 유형에 따라 패턴, 수식, 목록 및 문(예: 다음으로 시작 또는 다음으로 종료)을 사용하여 규칙을 만듭니다.

    Starts With 및 Ends With | 패턴 | 목록 | 수식

  8. 생성을 클릭합니다.
새 학습 인스턴스가 생성되면 Control Room자동화 > 문서 워크스페이스 폴더에 학습 인스턴스와 같은 이름의 폴더를 생성합니다. 이 폴더에는 두 개의 (추출 및 다운로드), 프로세스 및 양식이 포함됩니다.학습 인스턴스 자산의 예시 스크린샷
  • 프로세스: 업로드된 문서에서 Document Automation 데이터를 추출하고, 유효성 검사를 위해 사용자에게 문서를 할당하고, 추출된 데이터를 다운로드하는 IF/Else 시나리오를 사용하여 프로세스를 관리합니다. 자세한 내용은 Document Automation의 비즈니스 유저용 Automation Co-Pilot 프로세스 항목을 참조하십시오.
  • Extraction Bot: 업로드된 문서의 정의된 필드에서 데이터를 추출합니다.
  • 다운로드 Bot: 추출된 데이터를 기기 또는 공유 네트워크의 특정 폴더로 다운로드합니다.
  • 양식: 프로세스로 전송되는 입력 매개 변수를 정의합니다. 입력 매개 변수에는 학습 인스턴스 이름, 업로드된 파일 및 출력 파일 경로가 포함됩니다.

다음 단계

학습 인스턴스에 문서를 업로드하고, 검증 오류를 수정하고, 추출된 데이터를 확인합니다. Document Automation에서 문서 처리