Community Edition에서 학습 인스턴스 생성

학습 인스턴스를 만들어 문서 처리를 시작합니다. Community Edition에서 ABBYY OCR 공급자를 사용하여 지원되는 문서 유형과 언어에 대한 데이터를 추출할 수 있습니다.

프로시저

  1. Control Room 홈 페이지에서 AI > Document Automation 까지 이동한 후, 학습 인스턴스 생성을 클릭합니다.
  2. 학습 인스턴스의 이름 및 설명을 입력합니다.
    Document Automation은 중복 학습 인스턴스 이름을 허용하지 않으므로 제공하는 이름은 고유해야 합니다.
  3. 적절한 문서 유형을 선택합니다.
    주: 사용자 정의 문서 유형을 사용하여 이제 키-값 쌍과 테이블 구조가 포함된 송장과 시각적으로 유사한 문서(예: 구매 주문서 및 판매 주문서)를 처리할 수 있습니다. 이 문서 유형에서는 모든 양식 및 테이블 필드를 생성하고 구성합니다.
  4. 언어를 선택합니다.
  5. 옵션: 유효성 검사를 사용하여 정확도 향상 옵션을 사용하여 시스템에 피드백을 보내 추출 결과를 개선할 수 있습니다. 자세한 내용은 유효성 검사를 사용하여 추출 정확도 향상을 참조하십시오.
  6. 옵션: 추출에 생성형 AI 기능을 사용하려면 생성형 AI 기반 데이터 추출 옵션을 선택합니다. 자세한 내용은 Document Automation - 생성형 AI를 사용한 데이터 추출 항목을 참조하십시오.

    생성형 AI 공급자는 다음과 같은 이점을 제공합니다.

    • 대용량 비정형 문서의 효율적인 처리 가능
    • 영어 및 다른 언어로 된 문서 처리 가능
    다음 생성형 AI 공급자 중 하나를 선택합니다.
    주:
    • 이전 릴리스에서 v.38 이상으로 업데이트하면 Open AI가 기본 데이터 추출 공급자로 설정됩니다.
    • OpenAI 사용을 통해 문서를 처리한 다음 데이터 추출을 위해 Anthropic으로 전환한 경우 Anthropic으로 전환한 후 처리할 문서만 데이터 추출에 Anthropic을 사용합니다. 이전에 처리된 문서의 경우 추출된 데이터는 Azure OpenAI를 사용합니다.
    • 오픈 AI: Azure OpenAI 모델이 데이터 추출에 사용됩니다. 이 공급자는 내장된 라이선스(추가 라이선스 필요 없음) 및 BYOL(Bring Your Own License)을 통해 사용할 수 있습니다.

      BYOL을 사용하는 경우, 이 공급자를 사용하려면 추출 에서 OpenAI에 대한 추가 설정을 구성해야 합니다. 데이터 추출 작업 항목을 참조하십시오.

    • Anthropic: 이제 Anthropic에서 데이터 추출을 위해 생성형 AI 및 GCP에서 제공되는 AWS Document Automation 모델을 사용할 수 있습니다. 이 서비스는 귀사에서 인증한 생성형 AI 공급자에 따라 클라우드 모델을 선택할 수 있는 유연성을 제공합니다.

      BYOL을 사용하는 경우 이 공급자를 사용하려면 Google Vertex AI 또는 Amazon Bedrock 서비스에서 Anthropic Claude모델을 구성한 다음 추출 에서 추가 설정을 구성해야 합니다. 데이터 추출 작업 항목을 참조하십시오.

  7. 다음을 클릭합니다.

양식 및 테이블 필드를 구성할 때 샘플 문서를 Control Room 창과 나란히 여는 것이 좋습니다.

주:
  • 양식 필드는 한 문서에서 한 번만 발생하는 필드 유형입니다.
  • 테이블 필드는 문서 전체에서 반복되는 필드 유형으로, 일반적으로 테이블 형식입니다.

  1. 추출을 위한 양식 및 테이블 필드를 구성합니다. 자세한 내용은 필드 보기 및 검색 항목을 참조하십시오.
    1. 필드를 클릭하여 필드 편집기를 엽니다. 자세한 내용은 필드 편집 및 사용자 정의 별칭 생성 가이드라인 항목을 참조하십시오.
    2. 위쪽/아래쪽 화살표에 액세스하려면 필드 오른쪽에 있는 메뉴 아이콘 위로 마우스를 커서를 가져갑니다.
    3. 화살표를 사용하여 필드 순서를 다시 정렬하면 수동 유효성 검사를 보다 효율적으로 수행할 수 있습니다.
      필드 순서는 추출에 영향을 주지 않습니다.
    다른 필드 속성에 대해 자세히 알아보려면 양식 및 테이블 필드에 대한 고려 사항을 참조하십시오.
  2. 필드 추가를 클릭하고 필드 이름, 필드 라벨, 신뢰도, 데이터 유형, 서식 날짜/숫자 등과 같은 필드 세부 정보를 지정합니다. 자세한 내용은 양식 및 테이블 필드에 대한 고려 사항 항목을 참조하십시오.
    주: 생성형 AI-기반 데이터 추출 옵션을 선택한 경우, 학습 인스턴스를 생성할 때 예상된 결과를 얻을 수 있도록 필드에 적절한 프롬프트를 추가하는 것이 좋습니다. Document Automation - 생성형 AI를 사용한 데이터 추출 항목을 참조하십시오.
    다음 이미지는 학습 인스턴스에서 구성된 양식 및 테이블 필드를 보여줍니다.
    학습 인스턴스의 양식 필드

    학습 인스턴스의 테이블 필드 및 학습 인스턴스 수준에서 사용자 정의 테이블 추가
    주: 필드 추가 옵션은 영수증 문서 유형에 대해 사용할 수 없습니다.
  3. 생성을 클릭합니다.

다음 단계

학습 인스턴스에 문서를 업로드하고, 유효성 검사 오류를 수정하고, 추출된 데이터를 확인합니다. Community Edition에서 문서 처리