Community Editionにラーニングインスタンスを作成

ラーニングインスタンスを作成して、ドキュメントの処理を開始します。 Community Edition では、ABBYY OCR プロバイダーを利用して、対応するドキュメントタイプおよび言語のデータを抽出することが可能です。

手順

  1. Control Room ホームページから、 AI > ドキュメント オートメーション に移動し、 ラーニングインスタンスを作成 をクリックします。
  2. ラーニングインスタンスの名前と説明を入力します。
    Document Automation では、重複したラーニングインスタンス名を使用できないため、一意の名前を指定する必要があります。
  3. 適切なドキュメント タイプを選択します。
    注: ユーザー定義のドキュメント タイプを使用して、請求書と外観が似ていて、発注書や受注書などのキー値ペアとテーブル構造を含むドキュメントを処理します。 このドキュメント タイプでは、すべてのフォームとテーブルのフィールドを作成し、設定します。
  4. 言語を選択します。
  5. オプション: 検証を使用して精度を改善 オプションを使用すると、抽出結果を改善するためにフィードバックをシステムに送信することができます。 詳細については、検証による抽出精度の向上を参照してください。
  6. オプション: 機能を使用して抽出するには、生成 AI によるデータ抽出 オプションを選択し生成 AIます。 詳細については、Document Automation - 生成 AI を使用したデータ抽出を参照してください。

    生成 AI プロバイダーは、以下のメリットを提供します。

    • 大規模な非構造化ドキュメントを効率的に処理する
    • 英語と他の言語の両方のドキュメントを処理できる
    次のいずれかの 生成 AI プロバイダーを選択します。
    注:
    • 以前のリリースから v.38 以降に更新すると、Open AI がデフォルトのデータ抽出プロバイダーとして設定されます。
    • OpenAI を使用してドキュメントを処理した後、Anthropic に切り替えてデータを抽出する場合、Anthropic への切り替え後に処理されるドキュメントのみが、データ抽出に Anthropic を使用します。 以前に処理されたドキュメントについては、抽出されたデータは Azure OpenAI を使用します。
    • Open AI: Azure OpenAI モデルはデータ抽出に使用されます。 このプロバイダーは、組み込みライセンス (追加ライセンスを必要としない) および BYOL (Bring Your Own License) で利用可能です。

      BYOL を使用している場合、抽出 OpenAIBot用の追加設定を構成して、このプロバイダーを使用するようにしてください。 データの抽出 アクションを参照してください。

    • Anthropic: Anthropicや GCP で利用可能な 生成 AI AWS モデルを、Document Automationでのデータ抽出に使用できるようになりました。 このオファリングにより、御社が認定した生成 AI プロバイダーに応じて、クラウド モデルを柔軟に選択することができます。

      BYOL を使用している場合、このプロバイダーを使用するには、Anthropic Claude または Google Vertex AI サービスで Amazon Bedrock モデルを構成し、抽出 Bot で追加設定を構成する必要があります。 データの抽出 アクションを参照してください。

  7. 次へ をクリックします。

フォームおよびテーブル フィールドを構成するときは、サンプル ドキュメントを Control Room ウィンドウと並べて開くことをお勧めします。

注:
  • フォーム フィールドは、ドキュメントに 1 回だけ出現するフィールドのタイプです。
  • テーブル フィールドとは、ドキュメント中に繰り返し出現するフィールドのタイプで、通常はテーブルの形で出現します。

  1. 抽出するフォーム フィールドとテーブル フィールドを構成します。 詳細については、フィールドの表示と検索を参照してください。
    1. フィールドをクリックすると、フィールド エディターが開きます。 詳細については、フィールドを編集し、カスタム エイリアスを作成するためのガイドラインを参照してください。
    2. フィールドの右側にあるメニュー アイコンにマウス カーソルを合わせて、上下矢印を表示します。
    3. 矢印を使用してフィールドの順序を並べ替えて、より効率的に手動検証を行うことができます。
      フィールドの順序は抽出に影響しません。
    他のフィールド属性については、フォームとテーブル フィールドの考慮事項を参照してください。
  2. フィールドの追加 をクリックし、フィールド名、フィールド ラベル、信頼度、データ タイプ、日付/数値のフォーマットなどのフィールドの詳細を指定します。 詳細については、フォームとテーブル フィールドの考慮事項を参照してください。
    注: 生成 AI駆動のデータ抽出}オプションを選択した場合、学習インスタンスを作成する際に、期待される結果を得るためにフィールドに適切なプロンプトを追加することをお勧めします。 Document Automation - 生成 AI を使用したデータ抽出を参照してください。
    次の画像は、ラーニングインスタンスに設定されたフォームとテーブル フィールドを示しています。
    ラーニングインスタンスのフォームフィールド

    ラーニングインスタンスのテーブル フィールドとラーニングインスタンス レベルでのカスタム テーブルの追加
    注: フィールドを追加 オプションは、領収書 ドキュメント タイプでは使用できません。
  3. 作成 をクリックします。

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します (Community Edition でのドキュメントの処理)。