非構造化ドキュメント向けの 生成 AI を備えたラーニングインスタンスを作成する

このトピックをガイドとして使用し、契約書、合意書、レポート、レター、E メールなどの非構造化ドキュメントからデータを抽出する 生成 AI (GenAI) 機能を活用したラーニングインスタンスを作成します。

生成 AI を使用すると、トレーニングしなくても、非構造化ドキュメントからデータを抽出するラーニングインスタンスを作成できます。これは、迅速で正確なドキュメント処理に不可欠です。非構造化ドキュメントから正確なデータの抽出を可能にする 生成 AI 機能を備えたラーニングインスタンスを作成する手順を説明します。

前提条件

企業のプロの開発者は、以下のような業務を行います。
  • ラーニングインスタンスの作成、編集、削除
  • 処理とテストのためのドキュメントをアップロードする
  • 非公開フォルダーから公開フォルダーへのラーニングインスタンスのチェックインとチェックアウト

ライセンス要件: 上記のタスクを実行するための Bot Creator ライセンス。

割り当てられるロールと権限:
  • AAE_IQBot Services または AAE_IQBot Admin
  • AAE_Basic

手順

  1. Control Room にログインし、[マネージ] > [ラーニングインスタンス] に移動し、[ラーニングインスタンスを作成] ボタンをクリックして新しいラーニングインスタンスの作成を開始します。
  2. 次に、[ラーニングインスタンス] リストで簡単に識別できるように一意のラーニングインスタンス名を入力し、以下の他のオプションの選択に進みます。
    生成 AI 機能で非構造化ドキュメントのラーニングインスタンスを作成する
    1. 説明 (任意): これは、意味のある説明を追加し、ラーニングインスタンスの用途を要約するために使用できる任意指定のフィールドです。
    2. ドキュメント タイプ: 非構造化ドキュメント
      このオプションを選択すると、生成 AI を使ったデータ抽出機能が有効になります。これは、非構造化ドキュメント タイプではデフォルトで有効になります。
    3. 言語: 英語
      現在、サポートされているのは英語のみです。
    4. ロケール: ドキュメントのロケールに従っています。
      ロケールは、お使いの言語とドキュメントが作成された国に基づいて選択されます。
    5. プロバイダー: Automation Anywhere (ユーザー定義)
      現在はこのオプションのみが提供されているため、デフォルトでこの値が選択されています。
    6. OCR プロバイダー: Google Vision OCR または ABBYY OCR
      ABBYY OCR のサポートは、リリース v32 からの新機能です。
  3. [次へ] をクリックして、ラーニングインスタンスのフォームとテーブル フィールドの作成を開始します。
    フォーム フィールドとテーブル フィールドの作成についての詳細は、以下を参照してください。Document Automationにラーニングインスタンスを作成、ステップ 10-12。
  4. [フィールドを追加] をクリックして、ドキュメントからデータを抽出するデータ ポイントまたはエンティティごとにフィールドの追加を開始します。
  5. 次に、抽出するデータ ポイントに固有の [フィールド名]、デフォルトの検索クエリを作成するための [フィールド ラベル] を追加し、[データ タイプ] を選択してフィールド値のデータ構造を定義します。
    テキスト、数値、日付、または住所のデータ型の値オプションを、ドロップダウンから選択できます。
  6. 生成 AI 機能を活用する場合、[信頼度] フィールドはグレー表示されます。フィールドは、[必須] または [任意] に設定できます。
  7. [生成 AI モデルのクエリを検索] セクションで、システムが生成したクエリを使用するか、カスタム クエリを追加するかを選択できます。
    たとえば、総費用フィールドであれば、生成 AI のデフォルトのクエリは「総費用はいくらですか?」となるでしょう。クエリを「総費用はいくらですか? 通貨を除いた数字を抽出します」にカスタマイズできます。通貨情報を除いた総費用が抽出されます。
    生成 AI 機能を使用し、Document Automationのラーニングインスタンスのテーブル フィールドを作成
  8. 次のステップでは、フォーム フィールドとテーブル フィールドの [フィールド ルール] と [ドキュメント ルール] を定義します。
    テーブル フィールドの作成、[フィールド ルール] と [ドキュメント ルール] の追加についての詳細は、「Document Automationにラーニングインスタンスを作成」と「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。
  9. v32 からは、テーブル フィールドを定義する過程で複数のテーブルを定義できます。事例に基づいて、テーブル フィールド ドロップダウンの隣にある [テーブルの追加] アイコンをクリックして、追加のテーブルを定義できます。
    Document Automationにラーニングインスタンスを作成」、ステップ 12 を参照してください。
  10. [作成] をクリックして、ラーニングインスタンスの作成を完了します。

次のステップ

  1. ラーニングインスタンスを公開リポジトリに公開し、ラーニングインスタンスを公開モードで使用して実際のドキュメントからデータを抽出し、検証ツールでドキュメントを手動で検証できるようにします。「ラーニングインスタンスを本番環境に公開する」を参照してください。
  2. [マネージ] > [ラーニングインスタンス] リスト ページで、作成して公開したラーニングインスタンスを特定し、[プロセス] をクリックして、処理とデータ抽出のためドキュメントのアップロードを開始します。「Document Automation でのドキュメントの処理」を参照してください。
  3. 抽出されたデータを含む CSV ドキュメントを開き、処理されたドキュメントと比較すると、生成 AI が有効な検索クエリ フィールドで高い精度のデータが抽出されていることを検証および確認できます。