Automation 360

標準フォームの学習インスタンスを作成する

PDF としてダウンロード

コンテンツ

標準フォームの学習インスタンスを作成する

PDF としてダウンロード

最終更新日2026/04/23

学習インスタンスは、ドキュメントタイプ、言語、抽出するフィールドなどの情報を保持する構造です。 Standard Formsを作成した後、ドキュメントからデータを抽出するために学習インスタンスを作成する必要があります。

前提条件

Standard Forms構成が完了していることを確認します。
Control Room にDocument Automation Standard Forms (ページ数) 製品ライセンスがあることを確認します。

手順

Control Room ホームページから、AI > ドキュメントオートメーション > 新規作成に移動します。
学習インスタンスを作成ウィンドウが新しいタブで開きます。
作成する新しい学習インスタンスの名前を追加します。
ドキュメントタイプドロップダウンメニューから、Standard Forms を選択します。

注: プロバイダー名は、デフォルトで Microsoft Form Recognizer が選択されます。
モデルの選択には、参照をクリックし、名前または説明のフィルタを使用してモデルを検索してください。
モデルを選択し、選択をクリックします。
ドキュメントの処理に使用セクションで、次のいずれかのオプションを選択します。
- タスク Bot: これは、デフォルトオプションとなっております。 Bot Runnersを使用してデータ抽出を行います。
- クラウド抽出: Cloud Extraction Serviceを使用してデータ抽出を行います。
  注: クラウド抽出を使用するには、Enterprise PlatformライセンスとDocument AI Creditsを購入する必要があります。
違いを理解するには、タスク Bot とクラウド抽出の比較について、Cloud Extraction Service をご覧ください。
次へをクリックします。
次に進むには、次のフィールドを少なくとも 1 つ選択する必要があります。
- テーブル
- フォーム
注:
- ニューラルモデルの場合、テーブルフィールドは自動的に更新されないため、{table_name}: {field_name}の形式でテーブルフィールドを手動で追加する必要があります。
- ニューラルモデルでは、標準フォームは複数のテーブルをサポートし、テーブルはテーブルタブの下にテーブル名: フィールド名として表示されます。

その他のフィールド属性は、次のとおりです。

オプション	内容
フィールド名	アルファベット文字 (A～Z または a～z) で始まるフィールド名を入力します。標準フィールドでは、フィールド名はハードコードされているため変更できません。
フィールドラベル	検証者にとってわかりやすい名前を入力します。たとえば、組織の税番号を VAT 番号などのローカライズされた名前に変更できます。フィールドラベルは抽出に影響しません。
信頼度	誤検出の可能性を低減するためのしきい値を設定します。処理時に、Document Automation エンジンはドキュメントの各フィールドにスコアを割り当て、データが正しく抽出されたかどうかの確実度を示します。信頼度しきい値よりも低いスコアのフィールドがドキュメントに含まれている場合、ドキュメントは検証キューに送信されます。高い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が多くなります。低い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が少なくなります。 0 から 100 までの値がサポートされます。
データタイプ	次のいずれかのデータ型を選択します。住所: ドキュメントから住所フィールドを抽出する必要があるときに、このデータ型を使用してください。システムはさまざまな住所フィールドを抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書から住所を検出して抽出するよう指示します。テキスト: ドキュメントからテキストフィールドを抽出する必要があるときに、このデータ型を使用してください。システムはさまざまなテキストフィールドを抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書からテキストを検出して抽出するよう指示します。数値: ドキュメントから数値フィールドを抽出する必要があるときに、このデータ型を使用してください。システムはさまざまな数値フィールドを抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書から数字を検出して抽出するよう指示します。日付: ドキュメントから日付フィールドを抽出する必要があるときに、このデータ型を使用してください。システムはさまざまな日付形式を抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書から日付を検出して抽出するよう指示します。チェックボックス: チェックボックスがチェックされているか、チェックされていないか、または見つからないかを検証する必要がある場合は、このデータ型を使用してください。署名: ドキュメント内の署名を検証する必要があるときに、このデータ型を使用してください。このデータ型は、顧客が銀行に発行する小切手など、文書に署名が含まれているかどうかを確認する必要がある場合のシナリオで使用してください。注: モデルで署名検出のトレーニングを行う際は、署名オブジェクトをクリックするのではなく、リージョンオプションを使用して署名の領域をマークすることを確認してください。フィールドのデータがデータタイプと一致しない場合、ドキュメントは検証キューに送られます。 Document Automationは、日付フォーマットと数字フォーマットのバリエーションをサポートしています。ユーザー定義のドキュメントタイプでラーニングインスタンスを設定している場合、フォームフィールドには、アドレスの構造全体を抽出するアドレスデータタイプが含まれます。
必須	以下のいずれかを選択します。必須: フィールドは空にできません。任意: フィールドは空にできます。または、ドキュメントに存在しなくてもかまいません。
検証ルール	データタイプに応じて、パターン、数式、リスト、starts or ends withなどのステートメントを使用してルールを作成します。 Starts With と Ends With \| パターン \| リスト \| 公式

作成をクリックします。

新しい学習インスタンスが作成されると、Control RoomはAutomation > Document Workspaceフォルダー内に学習インスタンスと同じ名前のフォルダーを作成します。このフォルダーには、2 つの bots (抽出とダウンロード)、プロセス、フォームが含まれています。学習インスタンスアセットのスクリーンショット例

プロセス: Document Automation がアップロードされたドキュメントからデータを抽出し、検証のためにドキュメントをユーザーに割り当て、抽出されたデータをダウンロードする、if/else シナリオを使用してプロセスを管理します。詳細については、Automation Co-Pilot for Business UsersのプロセスDocument Automationをご参照ください。
抽出 Bot: アップロードされたドキュメントの定義済みフィールドからデータを抽出します。
Botをダウンロード: 抽出されたデータをデバイスまたは共有ネットワーク上の特定のフォルダーにダウンロードします。
フォーム: プロセスに送信される入力パラメーターを定義します。入力パラメーターには、ラーニングインスタンス名、アップロードしたファイル、および出力ファイルパスが含まれます。

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します (Document Automation でのドキュメントの処理)。