Community Edition에서 학습 인스턴스 생성

학습 인스턴스를 만들어 문서 처리를 시작합니다. Community Edition에서 ABBYY OCR 공급자를 사용하여 지원되는 문서 유형과 언어에 대한 데이터를 추출할 수 있습니다.

프로시저

  1. From the Control Room home page, navigate to AI > Document Automation , and click Create Learning Instance.
  2. Enter a name and description for the learning instance.
    Document Automation does not allow duplicate learning instance names, so the name you provide must be unique.
  3. 적절한 문서 유형을 선택합니다.
    주: 사용자 정의 문서 유형을 사용하여 이제 키-값 쌍과 테이블 구조가 포함된 송장과 시각적으로 유사한 문서(예: 구매 주문서 및 판매 주문서)를 처리할 수 있습니다. 이 문서 유형에서는 모든 양식 및 테이블 필드를 생성하고 구성합니다.
  4. 언어를 선택합니다.
  5. 옵션: 유효성 검사를 사용하여 정확도 향상 옵션을 사용하여 시스템에 피드백을 보내 추출 결과를 개선할 수 있습니다. 자세한 내용은 유효성 검사를 사용하여 추출 정확도 향상을 참조하십시오.
  6. 옵션: 추출에 생성형 AI 기능을 사용하려면 생성형 AI 기반 데이터 추출 옵션을 선택합니다. 자세한 내용은 Document Automation - 생성형 AI를 사용한 데이터 추출 항목을 참조하십시오.

    생성형 AI 공급자는 다음과 같은 이점을 제공합니다.

    • 대용량 비정형 문서의 효율적인 처리 가능
    • 영어 및 다른 언어로 된 문서 처리 가능
    다음 생성형 AI 공급자 중 하나를 선택합니다.
    주:
    • 이전 릴리스에서 v.38 이상으로 업데이트하면 Open AI가 기본 데이터 추출 공급자로 설정됩니다.
    • OpenAI 사용을 통해 문서를 처리한 다음 데이터 추출을 위해 Anthropic으로 전환한 경우 Anthropic으로 전환한 후 처리할 문서만 데이터 추출에 Anthropic을 사용합니다. 이전에 처리된 문서의 경우 추출된 데이터는 Azure OpenAI를 사용합니다.
    • 오픈 AI: Azure OpenAI 모델이 데이터 추출에 사용됩니다. 이 공급자는 내장된 라이선스(추가 라이선스 필요 없음) 및 BYOL(Bring Your Own License)을 통해 사용할 수 있습니다.

      BYOL을 사용하는 경우, 이 공급자를 사용하려면 추출 에서 OpenAI에 대한 추가 설정을 구성해야 합니다. 데이터 추출 작업 항목을 참조하십시오.

    • Anthropic: 이제 Anthropic에서 데이터 추출을 위해 생성형 AI 및 GCP에서 제공되는 AWS Document Automation 모델을 사용할 수 있습니다. 이 서비스는 귀사에서 인증한 생성형 AI 공급자에 따라 클라우드 모델을 선택할 수 있는 유연성을 제공합니다.

      BYOL을 사용하는 경우 이 공급자를 사용하려면 Google Vertex AI 또는 Amazon Bedrock 서비스에서 Anthropic Claude모델을 구성한 다음 추출 에서 추가 설정을 구성해야 합니다. 데이터 추출 작업 항목을 참조하십시오.

  7. Click Next.

We recommend that you open a sample document side by side with the Control Room window as you configure the form and table fields.

주:
  • A form field is a type of field that occurs only one time in a document.
  • A table field is a type of field that reoccurs throughout a document, typically in the form of a table.

  1. Configure the form and table fields for extraction. For more details, see 필드 보기 및 검색.
    1. Click a field to open the fields editor. For more details, see .필드 편집 및 사용자 정의 별칭 생성 가이드라인
    2. Hover over the menu icon to the right of a field to access the up/down arrows.
    3. Use the arrows to rearrange the order of the fields for a more efficient manual validation.
      The order of the fields does not impact extraction.
    To learn more about the other field attributes, see 양식 및 테이블 필드에 대한 고려 사항.
  2. Click Add a field and specify the fields details such as field name, fields label, confidence, data type, format date/number, and so on. For more details, see 양식 및 테이블 필드에 대한 고려 사항.
    주: If you have selected the Generative AI-driven data extraction option, we recommend that you add good prompts for fields to get the expected results when you create the learning instances. See Document Automation - 생성형 AI를 사용한 데이터 추출.
    The following image shows form and table fields configured in a learning instance:
    Form fields of a learning instance

    Table fields of a learning instance and adding custom table at learning instance level
    주: The Add a field option is not available for Receipts document type.
  3. Click Create.

다음 단계

학습 인스턴스에 문서를 업로드하고, 유효성 검사 오류를 수정하고, 추출된 데이터를 확인합니다. Community Edition에서 문서 처리