학습 인스턴스 생성

학습 인스턴스를 생성하고 트레이닝을 위해 샘플 문서를 업로드합니다. 이 단계에서는 송장 또는 구매 주문서와 같은 단일 문서 유형에 대한 데이터 요소와 추출할 필드를 정의합니다.

전제 조건

샘플 문서가 다음 요구 사항을 충족하는지 확인하십시오.
  • 각 문서는 별도의 파일입니다. 예를 들어 이메일과 그 첨부 파일을 하나의 PDF로 다운로드한 경우 이메일 본문을 첨부 파일과 분리해야 합니다. 문서 분할 작업 사용 항목을 참조하십시오.
  • 문서는 다음과 같이 지원되는 파일 유형 중 하나입니다.
    • PDF
    • JPG
    • JPEG
    • PNG
    • TIFF
  • 해상도 값이 300dpi 이상인 문서를 사용합니다.
  • 스테이징에서는 학습 인스턴스당 파일 크기가 10MB인 문서를 최대 150개까지 업로드할 수 있습니다.
  • 프로덕션에서는 문서당 최대 50MB 크기의 파일을 업로드할 수 있습니다. 그러나 학습 인스턴스당 허용되는 최대 문서 수는 라이선스에 따라 다릅니다.
  • pdfbox OCR의 문서당 페이지 수에는 제한이 없습니다.
  • 이미지 기반 OCR에서 문서당 60페이지를 업로드할 수 있습니다.
  • 최대 12MB 크기의 파일을 업로드할 수 있습니다. 학습 인스턴스를 생성한 후에도 다른 문서를 업로드할 수 있습니다.
  • 업로드하는 문서의 파일 이름은 하이픈(-)과 같은 특수 문자로 시작하지 않아야 합니다.
  • 추출하려는 텍스트가 다음 특수 문자로 시작하는 경우: ‘# : , \ ` '', 텍스트를 캡처할 때 특수 문자가 IQ Bot에서 무시됩니다.
주:
  • Tesseract4 OCR에는 현재 문서당 페이지 수를 60페이지 미만으로 제한하는 알려진 제한 사항이 있습니다.
  • Azure 기밀 컴퓨팅을 통해 조직은 암호화된 데이터를 가상 머신의 개인 폴더와 같은 보안 저장소에 업로드할 수 있습니다. 이러한 보안 폴더에서 IQ Bot으로 문서를 업로드하면 해당 문서에서 데이터 추출이 지원되지 않으므로 분류되지 않은 상태로 이동됩니다.

디지털 프로세스에 삽입할 문서 모음으로 시작할 때 문서 유형, 형식 및 방향이 혼합되어 있을 수 있습니다. 예를 들어 송장에는 일관된 데이터 요소 집합이 있는 반면 구매 주문서에는 서로 다른 데이터 요소 집합이 포함됩니다. 다음 단계를 사용하여 이러한 문서 유형 각각에 대해 다른 학습 인스턴스를 생성해야 합니다.

프로시저

  1. 학습 인스턴스로 이동하고 새 인스턴스 옵션을 클릭합니다.
  2. 새 학습 인스턴스 생성 화면에서 다음 정보를 입력합니다.
    1. 인스턴스 이름: 고유한 사용자 이름을 입력하십시오.
      IQ Bot 버전 A360.21 이하에서는 중복되는 학습 인스턴스 이름을 허용하지 않습니다. 학습 인스턴스를 삭제하더라도 이름은 다시 사용할 수 없습니다. IQ Bot 버전 A360.22에서는 중복되는 학습 인스턴스 이름을 생성하고 삭제된 학습 인스턴스 이름을 재사용할 수 있습니다.
    2. 옵션: 설명: 설명을 입력합니다.
    3. 문서 유형: 드롭다운 목록에서 문서 유형을 선택합니다.
      학습 인스턴스를 생성하는 동안 문서 유형으로 표준 양식을 선택하지 마십시오. 선택한 옵션에 따라 도메인 유형에 대해 사전 정의된 양식 및 테이블 필드 세트가 표시됩니다. 예를 들어, 송장을 선택하면 송장의 일반 양식 및 테이블이 나타납니다.
      주: 이 학습 인스턴스에 특별히 사용할 도메인을 생성하려면 문서 유형 > 기타를 선택하고 도메인 이름을 입력합니다. 다음 단계에서는 도메인을 사용자 지정합니다.

      사용자 지정 도메인 생성에 대한 자세한 내용은 다음 비디오를 시청하십시오.

      둘 이상의 학습 인스턴스에서 사용할 도메인을 만들고 필요한 액세스 권한이 있는 경우 Automation Anywhere 지원을 통해 사용자 지정 도메인을 생성할 수 있습니다. 자세한 정보는 IQ Bot의 사용자 지정 도메인에서 참고하십시오.

    4. 문서의 기본 언어: 드롭다운 메뉴를 사용하여 학습 인스턴스의 언어를 선택합니다.
      다른 언어로 맞춤형 도메인을 생성하고 IQ Bot이 지원하는 최대 190개 언어를 이용하려면 Automation Anywhere 지원 센터에 문의하십시오.
      중요사항: IQ Bot 인터페이스에서 모든 언어를 볼 수 없는 경우, 문제를 해결하십시오. Unable to extract data from Multiple languages in a document (A-People login required)
    5. 문서 업로드: 찾아보기를 클릭하여 샘플 문서를 업로드합니다.
  3. 일반 양식 필드일반 테이블/반복 섹션 필드에서 필드를 선택하거나 선택 취소합니다.
    양식 필드는 송장 날짜 또는 번호와 같이 문서에 한 번 표시됩니다. 테이블 필드는 항목 총계 또는 수량과 같이 문서 전체에서 반복되는 필드입니다.
    가능한 모든 필드를 보려면 추가 양식 필드 또는 추가 테이블/반복 섹션 필드를 클릭하십시오.
  4. 옵션: 추가 양식 필드 또는 추가 테이블/반복 섹션 필드에 필드 이름을 입력하여 추가 필드를 추가합니다.
    필드 추가(선택 사항) 필드에 이름을 입력할 때 명명 규칙을 따르십시오.
    • 필드 이름은 알파벳(A-Z 및 a-z)으로만 시작해야 합니다.
    • 필드 이름에는 영숫자 및 공백만 포함할 수 있습니다.
    • 필드 이름은 공백으로 끝날 수 없습니다.
  5. 광학 문자 인식: 필요한 OCR 엔진을 선택합니다.
  6. 옵션: 내 PDF 문서에는 이미지 확인란이 없습니다 확인란 선택을 취소합니다. 자세한 내용은 PDFBox 옵션 비활성화 항목을 참조하십시오.
    이 확인란을 선택하면 IQ Bot에서 PDFBox OCR을 사용하여 PDF 문서를 처리합니다. PDF가 아닌 문서는 이전 단계에서 선택한 OCR에 의해 처리됩니다.
  7. 확인란 자동 감지: 이 기능을 활성화하려면 확인란 감지 확인란을 선택합니다.
    이 옵션을 선택하면 IQ Bot이 문서의 확인란을 자동으로 검색할 수 있습니다. 그러나 문서의 처리 시간이 늘어날 수 있습니다.
  8. 인스턴스 생성 및 분석 옵션을 클릭하여 학습 인스턴스를 생성합니다.
    시스템은 필드 식별을 기반으로 트레이닝 문서를 분석하고, 논리 그룹으로 정렬하며, 세부 정보를 학습 인스턴스 > 요약 탭에 표시합니다.
새 학습 인스턴스가 생성되면 업로드한 샘플 문서가 문서 특성에 따라 분석되고 그룹으로 정렬됩니다. 자세한 내용은 분류기 정보을(를) 참조하십시오.

다음 단계

분류기가 문서 정렬을 마친 후에는 디자이너로 리디렉션되고, 여기에서 각 샘플 문서에서 데이터를 추출하도록 Bot을 트레이닝합니다. 학습 사례 교육.