Standard Forms のラーニングインスタンスの作成

ラーニングインスタンスは、ドキュメント タイプ、言語、抽出するフィールドなどの情報を保持する構造です。標準フォームを作成した後、ドキュメントからデータを抽出するためのラーニングインスタンスを作成する必要があります。

前提条件

  • 標準フォーム構成が完了していることを確認します。
  • Control RoomDocument Automation 標準フォーム (ページ数) 製品ライセンスがあることを確認します。

手順

  1. Control Room ホーム ページから、[マネージ] > [ラーニングインスタンス] > [ラーニングインスタンスの作成] に移動します。
    右上隅に [ラーニングインスタンスを作成] が表示される
    [ラーニングインスタンスを作成] ウィンドウが新しいタブで開きます。
  2. 作成する新しいラーニングインスタンスの名前を追加します。
  3. [ドキュメント タイプ] ドロップダウン メニューから、[Standard Forms] を選択します。
    ドキュメント タイプとしての標準フォーム
    注: プロバイダー名は、デフォルトで [Microsoft Form Recognizer] が選択されます。
  4. モデルの選択には、[参照] をクリックし、名前または説明のフィルタを使用してモデルを検索してください。
  5. モデルを選択し、[次へ] をクリックします。
  6. 次に進むには、次のフィールドを少なくとも 1 つ選択する必要があります。
    • テーブル
    • フォーム

    フォーム フィールド、テーブル フィールドのいずれかから選択
    注: Standard Forms は、複数のテーブルをサポートしています。ただし、Document Automationでは複数のテーブルを表示することはできません。したがって、テーブルは [テーブル] タブの下に [テーブル名:フィールド名] として表示されます。
  7. その他のフィールド属性は、次のとおりです。
    オプション説明
    フィールド名 アルファベット文字 (A ~ Z または a ~ z) で始まるフィールド名を入力します。

    標準フィールドでは、フィールド名はハードコードされているため変更できません。

    フィールド ラベル 検証者にとってわかりやすい名前を入力します。

    たとえば、組織の税番号VAT 番号などのローカライズされた名前に変更できます。

    フィールド ラベルは抽出に影響しません。

    信頼度 誤検出の可能性を低減するためのしきい値を設定します。

    処理時に、Document Automation エンジンはドキュメントの各フィールドにスコアを割り当て、データが正しく抽出されたかどうかの確実度を示します。信頼度しきい値よりも低いスコアのフィールドがドキュメントに含まれている場合、ドキュメントは検証キューに送信されます。

    高い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が多くなります。低い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が少なくなります。

    0 から 100 までの値がサポートされます。

    データ タイプ [アドレス] *、[テキスト]、[番号]、[日付] から選択します。

    フィールドのデータがデータ タイプと一致しない場合、ドキュメントは検証キューに送られます。

    Document Automation では、日付形式のバリエーションがサポートされます。
    注: ユーザー定義のドキュメント タイプでラーニングインスタンスを設定している場合、フォーム フィールドには、アドレスの構造全体を抽出するアドレス データ タイプが含まれます。
    必須 以下のいずれかを選択します。
    • 必須: フィールドは空にできません。
    • 任意: フィールドは空にできます。または、ドキュメントに存在しなくてもかまいません。
    検証ルール データ タイプに応じて、パターン、数式、リスト、「次で始まる」や「次で終わる」などのステートメントを使用してルールを作成します。

    Starts With と Ends With | パターン | リスト | 公式

  8. [作成] をクリックします。
新しいラーニングインスタンスが作成されると、[オートメーション] > [Document Workspace] フォルダー内のラーニングインスタンスと同じ名前のフォルダーが、Control Room によって作成されます。このフォルダーには、2 つの Bot (抽出とダウンロード)、プロセス、フォームが含まれています。ラーニングインスタンス アセットのスクリーンショット例
  • プロセス: Document Automation がアップロードされたドキュメントからデータを抽出し、検証のためにドキュメントをユーザーに割り当て、抽出されたデータをダウンロードする、if/else シナリオを使用してプロセスを管理します。詳細については、「Document Automation の Automation Co-Pilot プロセスについて」を参照してください
  • 抽出 Bot: アップロードされたドキュメントの定義済みフィールドからデータを抽出します。
  • ダウンロード Bot: 抽出されたデータをデバイスまたは共有ネットワーク上の特定のフォルダーにダウンロードします。
  • フォーム: プロセスに送信される入力パラメーターを定義します。入力パラメーターには、ラーニングインスタンス名、アップロードしたファイル、および出力ファイル パスが含まれます。

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します。Document Automation でドキュメントを処理