Standard Forms のラーニングインスタンスの作成

ラーニングインスタンスは、ドキュメント タイプ、言語、抽出するフィールドなどの情報を保持する構造です。 標準フォームを作成した後、ドキュメントからデータを抽出するためのラーニングインスタンスを作成する必要があります。

前提条件

  • 標準フォーム構成が完了していることを確認します。
  • Control Roomドキュメント オートメーション 標準フォーム (ページ数) 製品ライセンスがあることを確認します。

手順

  1. Control Room ホームページから、AI > ドキュメントオートメーション > ラーニングインスタンスを作成に移動します。
    右上隅に [ラーニングインスタンスを作成] が表示される
    [ラーニングインスタンスを作成] ウィンドウが新しいタブで開きます。
  2. 作成する新しいラーニングインスタンスの名前を追加します。
  3. [ドキュメント タイプ] ドロップダウン メニューから、[Standard Forms] を選択します。
    ドキュメント タイプとしての Standard Forms
    注: プロバイダー名は、デフォルトで [Microsoft Form Recognizer] が選択されます。
  4. モデルの選択には、[参照] をクリックし、名前または説明のフィルタを使用してモデルを検索してください。
  5. モデルを選択し、[次へ] をクリックします。
  6. 次に進むには、次のフィールドを少なくとも 1 つ選択する必要があります。
    • テーブル
    • フォーム

    フォーム フィールド、テーブル フィールドのいずれかから選択
    注:
    • ニューラル モデルの場合、テーブル フィールドは自動的に更新されないため、{table_name}: {field_name}の形式でテーブル フィールドを手動で追加する必要があります。
    • ニューラル モデルでは、標準フォームは複数のテーブルをサポートし、テーブルは [テーブル] タブの下に [テーブル名: フィールド名] として表示されます。
  7. その他のフィールド属性は、次のとおりです。
    オプション内容
    フィールド名 アルファベット文字 (A ~ Z または a ~ z) で始まるフィールド名を入力します。

    標準フィールドでは、フィールド名はハードコードされているため変更できません。

    フィールド ラベル 検証者にとってわかりやすい名前を入力します。

    たとえば、組織の税番号VAT 番号などのローカライズされた名前に変更できます。

    フィールド ラベルは抽出に影響しません。

    信頼度 誤検出の可能性を低減するためのしきい値を設定します。

    処理時に、ドキュメント オートメーション エンジンはドキュメントの各フィールドにスコアを割り当て、データが正しく抽出されたかどうかの確実度を示します。 信頼度しきい値よりも低いスコアのフィールドがドキュメントに含まれている場合、ドキュメントは検証キューに送信されます。

    高い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が多くなります。 低い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が少なくなります。

    0 から 100 までの値がサポートされます。

    データ タイプ アドレス *、テキスト番号日付 から選択します。

    フィールドのデータがデータ タイプと一致しない場合、ドキュメントは検証キューに送られます。

    ドキュメント オートメーション では、日付形式のバリエーションがサポートされます。
    注: ユーザー定義のドキュメント タイプでラーニングインスタンスを設定している場合、フォーム フィールドには、アドレスの構造全体を抽出するアドレス データ タイプが含まれます。
    必須 以下のいずれかを選択します。
    • 必須: フィールドは空にできません。
    • 任意: フィールドは空にできます。または、ドキュメントに存在しなくてもかまいません。
    検証ルール データ タイプに応じて、パターン、数式、リスト、「次で始まる」や「次で終わる」などのステートメントを使用してルールを作成します。

    Starts With と Ends With | パターン | リスト | 公式

  8. [作成] をクリックします。
新しいラーニングインスタンスが作成されると Control Room オートメーション ドキュメントワークプレース フォルダー内のラーニングインスタンスと同じ名前のフォルダーが、 > によって作成されます。 このフォルダーには、2 つの Bots (抽出とダウンロード)、プロセス、フォームが含まれています。
  • プロセス: ドキュメント オートメーション がアップロードされたドキュメントからデータを抽出し、検証のためにドキュメントをユーザーに割り当て、抽出されたデータをダウンロードする、if/else シナリオを使用してプロセスを管理します。 詳細については、「ビジネスユーザー向け Automation Co-Pilotのプロセスドキュメント オートメーション」を参照してください
  • 抽出 Bot: アップロードされたドキュメントの定義済みフィールドからデータを抽出します。
  • ダウンロード Bot: 抽出されたデータをデバイスまたは共有ネットワーク上の特定のフォルダーにダウンロードします。
  • フォーム: プロセスに送信される入力パラメーターを定義します。 入力パラメーターには、ラーニングインスタンス名、アップロードしたファイル、および出力ファイル パスが含まれます。

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します。 Document Automation でドキュメントを処理