標準フォームでカスタム抽出モデルを作成

標準フォーム 内で Control Roomの抽出モデルを作成します。

前提条件

  • Control Roomドキュメント オートメーション (ページ数) 製品ライセンスがあることを確認します。 ライセンスの詳細については、「ドキュメント オートメーション でのライセンスについて」をご覧ください。
  • このタスクを行うには、AAE_IQ Bot Admin または AAE_IQ Bot Services ロールが必要です
  • 5 ~ 15 のトレーニング ドキュメントを識別します
  • 標準フォームドキュメントタイプの最大制限は 157286400 バイトです。
  • カスタムニューラルモデルの使用に関する制限については、「Document Intelligence custom neural model」を参照してください。

手順

  1. Control Roomで、 AI > ドキュメント オートメーション に移動し、モデルを作成するをクリックします。
    注: 自分のライセンス (BYOL) を使用しているとき、モデルを作成するための モデル作成 オプションは学習インスタンスページに表示されません。 「Build and train a custom extraction model」を見てください。
    [プロジェクト] ウィンドウが新しいタブで開きます。
  2. [プロジェクトを作成] をクリックします。
  3. プロジェクトの名前を入力します。[参照] をクリックして、抽出モデルをトレーニングするためのドキュメントをアップロードし、[作成] をクリックします。
  4. フィールド タグを定義します。
    1. 画面の右上隅にあるプラス (+) アイコンをクリックし、[フィールド] を選択します。
    2. タグの名前を入力し、[入力] を選択します。 たとえば、Invoice NumberInvoice Date
    フィールド値領域の選択
    注: 各フィールド タグとそれに対応する位置タグには固有の色が割り当てられているため、データを視覚的に識別または検証するときに簡単に関連付けることができます。 フィールド タグをクリックすると、ドキュメント上の対応する位置タグが強調表示されます。
  5. テーブル タグを定義します。
    1. 画面の右上隅にあるプラス (+) アイコンをクリックし、[テーブル] を選択します。
      テーブル フィールドの追加
    2. テーブルの名前を入力し、[作成] をクリックします。
      テーブル名の追加
    3. テーブルの各列に対して、列名を選択し、次のいずれかのアクションを実行します。
      • 列名の変更: 列の名前を変更するにはこのオプションを選択して、[入力] を選択して名前を変更します。
      • 列を挿入: 選択した列の後に列を挿入するには、このオプションを選択します。
      • 列を削除: 選択した列を削除するには、このオプションを選択します。
    4. 列の詳細を更新します。
    5. オプション: 行を追加するには、プラス (+) アイコンをクリックします。
    6. 画面の右上隅にある閉じる (x) ボタンをクリックして、テーブル ビューを終了します。
    緑色の枠内に列名を入力
  6. 画面の左上隅にある [領域] オプションをクリックし、各フィールドのデータの場所を定義します。
    1. フォーム フィールドに対しては、抽出するデータの場所をハイライトし、対応するフィールド名をリストから選択します。
      フィールド名を追加
    2. テーブル内の各セルに対して、抽出するデータの場所をハイライトし、セルを選択します。 画面の右上隅にある閉じる (x) ボタンをクリックして、テーブル ビューを終了します。
      テーブル フィールド値領域を選択
    3. 次のドキュメントを選択し、手順を繰り返してフォームとテーブル フィールドの場所を定義します。
  7. [トレーニング] アイコンをクリックし、モデルの名前を入力します。
    トレインモデルアイコン
  8. 次のいずれかのモデルを選択します。
    • テンプレート: カスタム テンプレートはトレーニングが簡単なドキュメント モデルで、ラベル付きキーと値のペア、選択マーク、テーブル、領域、署名をドキュメントから正確に抽出することができます。 このモデルは通常、一貫したレイアウトと定義されたビジュアル テンプレートを持つ構造化ドキュメントからデータを抽出するために使用されます。 「Document Intelligence custom template model」を参照してください。
    • ニューラル: カスタム ニューラル モデルは、レイアウトと言語機能を組み合わせて、ラベル付きフィールドをドキュメントから正確に抽出する深層学習されたモデル タイプです。 このモデルは、半構造化ドキュメントや非構造化ドキュメントなど、さまざまな種類のドキュメントからデータを抽出するのに適しています。 「Document Intelligence custom neural model」を参照してください。
      重要: カスタム ニューラル モデルでは深層学習技術が使用されているため、モデルのトレーニングが完了するまでに時間がかかる場合があります。 そのため、カスタム モデル ページにモデルがすぐに表示されない場合があります。 トレーニングが完了するまで待ってから、このモデルを選択して使用することをお勧めします。
  9. [トレーニング] をクリックします。
  10. [分析] アイコンをクリックし、[ファイルを参照] をクリックして、ドキュメントを選択したら、[分析を実行] をクリックして抽出モデルをテストします。
    注: Automation 360 v.29 では、Azure AI Document Intelligence v.3.0 でのみ、新しいモデルの作成とトレーニングが可能です。 Azure AI Document Intelligence v.2.1 をお使いの方は、以下の手順で Azure AI Document Intelligence v.3.0 に更新する必要があります。
    1. [プロジェクト] を開きます。
    2. [トレーニング] アイコンをクリックします。
    3. [トレーニング] をクリックします。 モデルは Azure AI Document Intelligence v.3.0 で作成されています。

次のステップ

Standard Forms のラーニングインスタンスの作成
注: 抽出モデルをラーニングインスタンスに関連付けた後に抽出モデルを編集することはできません。