Document Automationにラーニングインスタンスを作成

請求書、公共料金の請求書、または領収書からデータを抽出するためのラーニングインスタンスを作成することで、ドキュメントの処理を開始します。ラーニングインスタンスは、ドキュメント タイプ、言語、抽出するフィールドなどの情報を保持する構造です。

前提条件

  • ラーニングインスタンスを作成するには、Learning instance creator ユーザーでなければなりません。「Document Automation 人のユーザー」を参照してください。
  • デフォルトの OCR は ABBYY FineReader エンジン です。また、Cloud Control Room のユーザーは、Google Vision OCR でドキュメントを処理するラーニングインスタンスを作成できます。

ラーニングインスタンスを作成するための完全なエンドツーエンド プロセスについては、このビデオをご覧ください。

手順

  1. Control Room ホームページから、[マネージ] > [ラーニングインスタンス] > [ラーニングインスタンスの作成] に移動します。
  2. ラーニングインスタンスの名前と説明を入力します。
    Document Automation では、重複したラーニングインスタンス名を使用できないため、一意の名前を指定する必要があります。
  3. ドキュメント タイプを選択します。[請求書][ユーザー定義]、[公共料金請求書]、または [領収書]
    ユーザー定義のドキュメント タイプを使用して、請求書と外観が似ていて、発注書や受注書などのキー値ペアとテーブル構造を含むドキュメントを処理します。このドキュメント タイプでは、すべてのフォームとテーブルのフィールドを作成し、設定します。
  4. 言語を選択します。
    Document Automationは、英語、オランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語 (ブラジル)、スペイン語に対応しています。詳細については、「Document Automationでサポートされている言語」を参照してください。
    注: ドイツ語のドキュメント抽出は現在プレビュー中です。抽出結果は、今後のリリースで改善される予定です。

    ステップ 3 でパーサーを構成する際に使用するドキュメント タイプを選択すると、パーサーの構成時に選択した言語が自動的に選択されます。さらに、ロケール リストには、自動選択された言語に基づいた言語オプションが表示されます。

  5. 請求書を選択した場合: プロバイダーを選択します。
    ステップ 4 で英語を選択した場合、Automation Anywhere (トレーニング済み) が自動で選択されます。

    ステップ 3 でパーサーを設定する際に使用するドキュメント タイプを選択すると、構成した (サードパーティの) パーサーがプロバイダーとして自動的に選択されます。

  6. オプション: OCR プロバイダーを選択します。デフォルトでは、Document AutomationABBYY FineReader エンジン でドキュメントを処理します。
    Cloud Control Room を使用しているユーザーは、Google Vision OCR でドキュメントを処理するように選択できます。
  7. オプション: [検証を使用して精度を改善] オプションを使用すると、抽出結果を改善するためにフィードバックをシステムに送信することができます。詳細については、「検証による抽出精度の向上」を参照してください。
    注: [検証を使用して精度を改善] オプションは、[公共料金請求書] と [領収書] ドキュメント タイプでは使用できません。
  8. オプション: 生成 AI 機能を使用して抽出するには、[生成 AI によるデータ抽出] オプションを選択します。詳細については、「生成 AI を用いた Document Automation のデータ抽出」を参照してください。
    Document Automation でラーニングインスタンスの作成
  9. [次へ] をクリックします。

フォームおよびテーブル フィールドを構成するときは、サンプル ドキュメントを Control Room ウィンドウと並べて開くことをお勧めします。

注:
  • フォーム フィールドは、ドキュメントに 1 回だけ出現するフィールドのタイプです。
  • テーブル フィールドとは、ドキュメント中に繰り返し出現するフィールドのタイプで、通常はテーブルの形で出現します。

  1. 抽出するフォーム フィールドとテーブル フィールドを構成します。詳細については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。
    1. フィールドをクリックすると、フィールド エディターが開きます。詳細については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。
    2. フィールドの右側にあるメニュー アイコンにマウス カーソルを合わせて、上下矢印を表示します。
    3. 矢印を使用してフィールドの順序を並べ替えて、より効率的に手動検証を行うことができます。
      フィールドの順序は抽出に影響しません。
    他のフィールド属性については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。
  2. [フィールドの追加] をクリックし、フィールド名、フィールド ラベル、信頼度、データ タイプ、日付/数値のフォーマットなどのフィールドの詳細を指定します。詳細については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。
    次の画像は、ラーニングインスタンスに設定されたフォームとテーブル フィールドを示しています。
    ラーニングインスタンスのフォーム フィールド

    ラーニングインスタンスのテーブル フィールドとラーニングインスタンス レベルでのカスタム テーブルの追加
  3. オプション: [テーブル フィールド] タブで、[+] アイコンをクリックして、ラーニングインスタンス レベルでカスタム テーブルを追加します。
    1. テーブルの名前を入力し、[追加] をクリックします。
    2. [フィールドの追加] をクリックし、フィールド名、フィールド ラベル、信頼度、データ タイプ、日付/数値のフォーマットなどのフィールドの詳細を指定します。詳細については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。
      注: また、ラーニングインスタンスの編集中にカスタム テーブルを追加および削除することもできます。
    カスタム テーブルは [テーブル] ドロップダウン リストに表示されます。
    ラーニングインスタンス レベルで作成され、ドロップダウン リストに表示されるテーブル

    また、[ドキュメント ルール] タブでカスタム テーブルとデフォルト テーブルのフィールドを表示することもできますが、すべての異なるテーブルにわたりフィールドを選択することはできません。複数のテーブル サポートの詳細については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。

  4. [作成] をクリックします。
新しいラーニングインスタンスが作成されると、[オートメーション] > [Document Workspace] フォルダー内のラーニングインスタンスと同じ名前のフォルダーが、Control Room によって作成されます。このフォルダーには、2 つの Bot (抽出とダウンロード)、プロセス、フォームが含まれています。詳細については、「Document Automationでラーニングインスタンスを作成するためのリファレンス」を参照してください。

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します (Document Automation でのドキュメントの処理)。