Community Editionにラーニングインスタンスを作成

ラーニングインスタンスを作成して、ドキュメントの処理を開始します。 Community Edition では、ABBYY OCR プロバイダーを利用して、対応するドキュメントタイプおよび言語のデータを抽出することが可能です。

手順

  1. From the Control Room home page, navigate to AI > ドキュメント オートメーション , and click Create Learning Instance.
  2. Enter a name and description for the learning instance.
    Document Automation does not allow duplicate learning instance names, so the name you provide must be unique.
  3. 適切なドキュメント タイプを選択します。
    注: ユーザー定義のドキュメント タイプを使用して、請求書と外観が似ていて、発注書や受注書などのキー値ペアとテーブル構造を含むドキュメントを処理します。 このドキュメント タイプでは、すべてのフォームとテーブルのフィールドを作成し、設定します。
  4. 言語を選択します。
  5. オプション: 検証を使用して精度を改善 オプションを使用すると、抽出結果を改善するためにフィードバックをシステムに送信することができます。 詳細については、検証による抽出精度の向上を参照してください。
  6. オプション: 機能を使用して抽出するには、生成 AI によるデータ抽出 オプションを選択し生成 AIます。 詳細については、Document Automation - 生成 AI を使用したデータ抽出を参照してください。

    生成 AI プロバイダーは、以下のメリットを提供します。

    • 大規模な非構造化ドキュメントを効率的に処理する
    • 英語と他の言語の両方のドキュメントを処理できる
    次のいずれかの 生成 AI プロバイダーを選択します。
    注:
    • 以前のリリースから v.38 以降に更新すると、Open AI がデフォルトのデータ抽出プロバイダーとして設定されます。
    • OpenAI を使用してドキュメントを処理した後、Anthropic に切り替えてデータを抽出する場合、Anthropic への切り替え後に処理されるドキュメントのみが、データ抽出に Anthropic を使用します。 以前に処理されたドキュメントについては、抽出されたデータは Azure OpenAI を使用します。
    • Open AI: Azure OpenAI モデルはデータ抽出に使用されます。 このプロバイダーは、組み込みライセンス (追加ライセンスを必要としない) および BYOL (Bring Your Own License) で利用可能です。

      BYOL を使用している場合、抽出 OpenAIBot用の追加設定を構成して、このプロバイダーを使用するようにしてください。 データの抽出 アクションを参照してください。

    • Anthropic: Anthropicや GCP で利用可能な 生成 AI AWS モデルを、Document Automationでのデータ抽出に使用できるようになりました。 このオファリングにより、御社が認定した生成 AI プロバイダーに応じて、クラウド モデルを柔軟に選択することができます。

      BYOL を使用している場合、このプロバイダーを使用するには、Anthropic Claude または Google Vertex AI サービスで Amazon Bedrock モデルを構成し、抽出 Bot で追加設定を構成する必要があります。 データの抽出 アクションを参照してください。

  7. Click Next.

We recommend that you open a sample document side by side with the Control Room window as you configure the form and table fields.

注:
  • A form field is a type of field that occurs only one time in a document.
  • A table field is a type of field that reoccurs throughout a document, typically in the form of a table.

  1. Configure the form and table fields for extraction. For more details, see フィールドの表示と検索.
    1. Click a field to open the fields editor. For more details, see .フィールドを編集し、カスタム エイリアスを作成するためのガイドライン
    2. Hover over the menu icon to the right of a field to access the up/down arrows.
    3. Use the arrows to rearrange the order of the fields for a more efficient manual validation.
      The order of the fields does not impact extraction.
    To learn more about the other field attributes, see フォームとテーブル フィールドの考慮事項.
  2. Click Add a field and specify the fields details such as field name, fields label, confidence, data type, format date/number, and so on. For more details, see フォームとテーブル フィールドの考慮事項.
    注: If you have selected the Generative AI-driven data extraction option, we recommend that you add good prompts for fields to get the expected results when you create the learning instances. See Document Automation - 生成 AI を使用したデータ抽出.
    The following image shows form and table fields configured in a learning instance:
    Form fields of a learning instance

    Table fields of a learning instance and adding custom table at learning instance level
    注: The Add a field option is not available for Receipts document type.
  3. Click Create.

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します (Community Edition でのドキュメントの処理)。