Document Automation에서 학습 인스턴스 생성

지원되는 다양한 문서 유형에서 데이터를 추출하는 학습 인스턴스를 생성하여 문서 처리를 시작합니다. 학습 인스턴스는 문서 유형, 언어, 추출할 필드 등의 정보를 담고 있는 구조입니다.

전제 조건

  • 학습 인스턴스를 생성하려면 Learning instance creator 사용자여야 합니다. Document Automation 사용자 항목을 참조하십시오.
  • OCR을 지원하는 문서 유형의 경우 기본 OCR은 ABBYY FineReader Engine입니다.또는 학습 인스턴스를 생성하여 Google Vision OCR을 사용하는 문서를 처리할 수 있습니다.
  • 표준 양식 문서 유형의 경우, 사용자 정의 추출 모델을 만들었는지 확인하십시오. 표준 양식을 사용하여 사용자 정의 추출 모델 생성 항목을 참조하십시오.

학습 인스턴스를 생성하는 전체 엔드투엔드 프로세스를 보려면 이 비디오를 시청하십시오.

프로시저

  1. Control Room 홈 페이지에서 AI > Document Automation 까지 이동한 후, 학습 인스턴스 생성을 클릭합니다.
  2. 학습 인스턴스의 이름 및 설명을 입력합니다.
    Document Automation은 중복 학습 인스턴스 이름을 허용하지 않으므로 제공하는 이름은 고유해야 합니다.
  3. 적절한 문서 유형을 선택합니다.
    주: 사용자 정의 문서 유형을 사용하여 이제 키-값 쌍과 테이블 구조가 포함된 송장과 시각적으로 유사한 문서(예: 구매 주문서 및 판매 주문서)를 처리할 수 있습니다. 이 문서 유형에서는 모든 양식 및 테이블 필드를 생성하고 구성합니다.
  4. 언어를 선택합니다.
    Document Automation에서 지원되는 언어에 대한 자세한 내용은 Document Automation에서 지원되는 언어 항목을 참조하십시오.

    3단계에서 파서를 구성하는 동안 사용되는 문서 유형을 선택하면, 파서 구성 시 선택한 언어가 자동으로 선택됩니다. 또한 로케일 목록에 자동 선택된 언어에 따라 언어 옵션이 표시됩니다.

  5. 공급자를 선택합니다.
    4단계에서 영어를 선택했다면 Automation Anywhere(사전 교육)이 자동으로 선택됩니다.

    3단계에서 파서를 구성하는 동안 사용되는 문서 유형을 선택하면 구성된(타사) 파서가 공급자로 자동 선택됩니다.

  6. 옵션: OCR 공급자를 선택합니다. 기본적으로 Document AutomationABBYY FineReader Engine의 문서를 처리합니다.
    Cloud Control Room가 있는 사용자는 Google Vision OCR의 문서를 처리하도록 선택할 수 있습니다.
  7. 옵션: 유효성 검사를 사용하여 정확도 향상 옵션을 사용하여 시스템에 피드백을 보내 추출 결과를 개선할 수 있습니다. 자세한 내용은 유효성 검사를 사용하여 추출 정확도 향상을 참조하십시오.
    주: 유효성 검사를 사용하여 정확도 향상 옵션은 선택한 문서 유형에 대해서만 지원됩니다.
  8. 옵션: 추출에 생성형 AI 기능을 사용하려면 생성형 AI 기반 데이터 추출 옵션을 선택합니다. 자세한 내용은 Document Automation - 생성형 AI를 사용한 데이터 추출 항목을 참조하십시오.
    다음 생성형 AI 공급자 중 하나를 선택합니다.
    주:
    • 생성형 AI 기반 데이터 추출 옵션을 사용하려면 문서 추출 패키지 버전 3.31.16 이상을 사용하고 있는지 확인합니다. 문서 추출 패키지 업데이트 항목을 참조하십시오.
    • 생성형 AI 기반 데이터 추출 옵션은 선택한 문서 유형에 대해서만 지원됩니다. 일부 문서 유형은 생성형 AI 기반 데이터 추출 옵션이 기본적으로 활성화되어 있으며 비활성화할 수 없습니다. 이러한 문서 유형에 대해서만 생성형 AI 공급자를 선택할 수 있습니다.
    • 이전 릴리스에서 v.33 이상으로 업데이트하면 Open AI가 기본 데이터 추출 공급자로 설정됩니다.
    • 학습 인스턴스에서 데이터 추출 공급자로 Anthropic을 선택하고 해당 추출 Anthropic에서 필요한 설정을 구성하지 않으면 문서를 처리할 때 오류가 표시됩니다.
    • 학습 인스턴스에 대한 Anthropic 공급자를 선택하고 Anthropic 설정을 잘못 구성했거나 해당 추출 에서 다른 공급자를 선택한 경우 문서를 처리할 때 오류가 표시됩니다.
    • OpenAI 사용을 통해 문서를 처리한 다음 데이터 추출을 위해 Anthropic으로 전환한 경우 Anthropic으로 전환한 후 처리할 문서만 데이터 추출에 Anthropic을 사용합니다. 이전에 처리된 문서의 경우 추출된 데이터는 OpenAI를 사용합니다.
    • Open AI: OpenAI는 콘텐츠 생성, 요약, 이미지 이해, 시맨틱 검색, 자연어에서 코드 번역까지 Open AI의 강력한 언어 모델에 액세스할 수 있는 기능을 제공합니다. 이 공급자는 내장된 라이선스(추가 라이선스 필요 없음) 및 BYOL(Bring Your Own License)을 통해 사용할 수 있습니다. BYOL을 사용하는 경우, 이 공급자를 사용하려면 추출 에서 OpenAI에 대한 추가 설정을 구성해야 합니다. 데이터 추출 작업 항목을 참조하십시오.
    • Anthropic: 이제 Anthropic에서 데이터 추출을 위해 생성형 AI 및 GCP에서 제공되는 AWS Document Automation 모델을 사용할 수 있습니다. 이 서비스는 귀사에서 인증한 생성형 AI 공급자에 따라 클라우드 모델을 선택할 수 있는 유연성을 제공합니다.

      Anthropic에서는 다음과 같은 이점을 제공합니다.

      • 대용량 비정형 문서의 효율적인 처리 가능
      • 영어 및 다른 언어로 된 문서 처리 가능
      • 데이터 추출 정확도가 향상되어 문서를 빠르게 처리 가능

      BYOL을 사용하는 경우 이 공급자를 사용하려면 Anthropic Claude 또는 Google Vertex AI 서비스에서 Amazon Bedrock 모델을 구성한 다음 추출 에서 추가 설정을 구성해야 합니다. 데이터 추출 작업 항목을 참조하십시오.

    Document Automation에 학습 인스턴스 생성
  9. 다음을 클릭합니다.

양식 및 테이블 필드를 구성할 때 샘플 문서를 Control Room 창과 나란히 여는 것이 좋습니다.

주:
  • 양식 필드는 한 문서에서 한 번만 발생하는 필드 유형입니다.
  • 테이블 필드는 문서 전체에서 반복되는 필드 유형으로, 일반적으로 테이블 형식입니다.

  1. 추출을 위한 양식 및 테이블 필드를 구성합니다. 자세한 내용은 항목을 참조하십시오.
    1. 필드를 클릭하여 필드 편집기를 엽니다. 자세한 내용은 항목을 참조하십시오.
    2. 위쪽/아래쪽 화살표에 액세스하려면 필드 오른쪽에 있는 메뉴 아이콘 위로 마우스를 커서를 가져갑니다.
    3. 화살표를 사용하여 필드 순서를 다시 정렬하면 수동 유효성 검사를 보다 효율적으로 수행할 수 있습니다.
      필드 순서는 추출에 영향을 주지 않습니다.
    다른 필드 속성에 대해 자세히 알아보려면 을 참조하십시오.
  2. 필드 추가를 클릭하고 필드 이름, 필드 라벨, 신뢰도, 데이터 유형, 서식 날짜/숫자 등과 같은 필드 세부 정보를 지정합니다. 자세한 내용은 항목을 참조하십시오.
    다음 이미지는 학습 인스턴스에서 구성된 양식 및 테이블 필드를 보여줍니다.
    학습 인스턴스의 양식 필드

    학습 인스턴스의 테이블 필드 및 학습 인스턴스 수준에서 사용자 정의 테이블 추가
    주: 필드 추가 옵션은 영수증 문서 유형에 대해 사용할 수 없습니다.
  3. 옵션: 테이블 필드 탭에서 + 아이콘을 클릭하여 학습 인스턴스 수준에서 사용자 정의 테이블을 추가합니다.
    1. 테이블의 이름을 입력하고 추가를 클릭합니다.
    2. 필드 추가를 클릭하고 필드 이름, 필드 라벨, 신뢰도, 데이터 유형, 서식 날짜/숫자 등과 같은 필드 세부 정보를 지정합니다. 자세한 내용은 항목을 참조하십시오.
      주: 학습 인스턴스를 수정하는 동안 사용자 정의 테이블을 추가 및 삭제할 수도 있습니다.
    사용자 정의 테이블은 테이블 드롭다운 목록에 표시됩니다.
    학습 인스턴스 수준에서 생성되고 드롭다운 목록에 표시되는 테이블

    문서 규칙 탭에서 사용자 정의 및 기본 테이블의 필드를 볼 수도 있지만, 서로 다른 모든 테이블의 필드를 선택할 수는 없습니다. 다중 테이블 지원에 대한 자세한 내용은 항목을 참조하십시오.

  4. 생성을 클릭합니다.
새 학습 인스턴스가 생성되면 Control Room자동화 > Document Workspace Processes 프로세스 폴더에 학습 인스턴스와 같은 이름의 폴더를 생성합니다. 이 폴더에는 두 개의 (추출 및 다운로드), 프로세스 및 양식이 포함됩니다. 자세한 내용은 항목을 참조하십시오.

다음 단계

학습 인스턴스에 문서를 업로드하고, 유효성 검사 오류를 수정하고, 추출된 데이터를 확인합니다. Document Automation에서 문서 처리