표준 양식을 사용하여 사용자 정의 추출 모델 생성

표준 양식에서 Control Room 추출 모델을 생성합니다.

전제 조건

  • Control RoomDocument Automation(페이지 수) 제품 라이선스가 있는지 확인하십시오. 라이선스에 대한 자세한 정보는 Document Automation의 라이선스 이해 항목을 참조하십시오.
  • 이 태스크를 완료하려면 AAE_IQ Bot Admin 또는 AAE_IQ Bot Services 역할이 있어야 합니다.
  • 5~15개의 교육 문서를 식별합니다.
  • 표준 양식 문서 유형의 최대 한도는 157286400 바이트입니다.
  • 사용자 정의 신경망 모델 사용의 제한 사항에 대한 정보는 Document Intelligence custom neural model 항목을 참조하십시오.

프로시저

  1. Control Room에서 AI > Document Automation 으로 이동한 다음 모델 생성을 클릭합니다.
    주: 자체 라이선스(BYOL)를 사용할 경우 학습 인스턴스 페이지에서 모델을 생성하기 위한 모델 생성 옵션을 볼 수 없습니다. Build and train a custom extraction model 항목을 참조하십시오.
    프로젝트 창이 새 탭에서 열립니다.
  2. 프로젝트 생성을 클릭합니다.
  3. 프로젝트의 이름을 입력하고 찾아보기를 클릭하여 추출 모델을 트레이닝할 문서를 업로드한 후 생성을 클릭합니다.
  4. 필드 태그를 정의합니다.
    1. 화면 오른쪽 상단의 더하기(+) 아이콘을 클릭하고 필드를 선택합니다.
    2. 태그의 이름을 입력하고 Enter를 선택합니다. 예를 들면, Invoice Number 또는 Invoice Date를 입력합니다.
    필드 값 영역 선택
    주: 각 필드 태그와 해당 위치 태그는 고유한 색상이 할당되므로 데이터를 시각적으로 구별하거나 확인할 때 쉽게 연결할 수 있습니다. 필드 태그를 클릭하면 문서에서 해당 위치 태그가 강조 표시됩니다.
  5. 다음과 같이 테이블 태그를 정의합니다.
    1. 화면 오른쪽 상단의 더하기(+) 아이콘을 클릭하고 테이블을 선택합니다.
      테이블 필드 추가
    2. 테이블의 이름을 입력하고 만들기를 클릭합니다.
      테이블 이름 추가
    3. 테이블 내의 각 열에 대해 열 이름을 선택하고 다음 작업 중 하나를 수행하십시오.
      • 열 이름 변경: 열 이름을 바꾸려면 이 옵션을 선택하고 Enter를 선택하여 이름을 변경합니다.
      • 열 삽입: 선택한 열 뒤에 열을 삽입하려면 이 옵션을 선택합니다.
      • 열 삭제: 선택한 열을 삭제하려면 이 옵션을 선택합니다.
    4. 열 세부 정보를 업데이트합니다.
    5. 옵션: 행을 더 추가하려면 더하기(+) 아이콘을 클릭합니다.
    6. 테이블 보기를 종료하려면 화면 오른쪽 상단의 닫기(X) 버튼을 클릭합니다.
    녹색 테두리 상자에 열 이름을 입력합니다.
  6. 화면의 왼쪽 상단 모서리에 있는 영역 옵션을 클릭하고 각 필드의 데이터 위치를 정의합니다.
    1. 양식 필드의 경우 추출할 데이터의 위치를 강조 표시하고 목록에서 해당 필드 이름을 선택합니다.
      필드 이름 추가
    2. 테이블의 각 셀에서 추출할 데이터의 위치를 강조 표시한 다음 해당 셀을 선택합니다. 테이블 보기를 종료하려면 화면 오른쪽 상단의 닫기(X) 버튼을 클릭합니다.
      테이블 필드 값 영역 선택
    3. 다음 문서를 선택하고 단계를 반복하여 양식 및 테이블 필드의 위치를 정의합니다.
  7. 트레이닝 아이콘을 클릭한 후 모델 이름을 입력합니다.
    모델 훈련 아이콘
  8. 다음 모델 중 하나를 선택합니다.
    • 템플릿: 사용자 정의 템플릿은 문서에서 레이블이 지정된 키-값 쌍, 선택 표시, 표, 영역 및 서명을 정확하게 추출하는 학습하기 쉬운 문서 모델입니다. 이 모델은 일반적으로 일관된 레이아웃과 정의된 시각적 템플릿이 있는 구조화된 문서에서 데이터를 추출하는 데 사용됩니다. Document Intelligence custom template model 항목을 참조하십시오.
    • 신경: 사용자 정의 신경 모델은 레이아웃과 언어 기능을 결합하여 문서에서 레이블이 지정된 필드를 정확하게 추출하는 딥 러닝 모델 유형입니다. 이 모델은 반정형 및 비정형 문서와 같은 다양한 문서 유형에서 데이터를 추출하는 데 더 적합합니다. Document Intelligence custom neural model 항목을 참조하십시오.
      중요사항: 사용자 정의 신경 모델은 딥 러닝 기술을 사용하므로 모델에 대한 교육을 완료하는 데 시간이 걸릴 수 있습니다. 따라서 사용자 정의 모델 페이지에 해당 모델이 바로 표시되지 않을 수 있습니다. 교육이 완료될 때까지 기다린 다음 해당 모델을 선택하여 사용할 것을 권장합니다.
  9. 학습을 클릭하십시오.
  10. 분석 아이콘을 클릭하고 파일 찾아보기를 클릭한 다음, 원하는 문서를 선택하고 분석 실행을 클릭하여 추출 모델을 테스트합니다.
    주: 현재 Automation 360 v.29에서는 Azure AI Document Intelligence v.3.0에서만 새 모델을 생성하고 교육할 수 있습니다. Azure AI Document Intelligence v.2.1을 사용 중인 경우 아래 단계에 따라 Azure AI Document Intelligence v.3.0으로 업데이트해야 합니다.
    1. 프로젝트를 여십시오.
    2. 트레이닝 아이콘을 클릭합니다.
    3. 학습을 클릭하십시오. 해당 모델은 Azure AI Document Intelligence v.3.0에서 생성됩니다.

다음 단계

표준 양식에 대한 학습 인스턴스 생성
주: 추출 모델은 학습 인스턴스와 연결한 후에는 편집할 수 없습니다.