ドキュメント オートメーションでラーニングインスタンスを作成する際の考慮事項

ラーニングインスタンスを作成するときは、フォームとテーブル フィールド、検索フィールド、ラーニングインスタンス作成後の出力フォルダーに関する追加情報などについて、次の考慮事項に留意してください。

フィールドの表示と検索

ドキュメント オートメーション には、フォームおよびテーブル フィールドの標準セットが用意されていますが、その多くは初期状態では表示されません。 フィールド名、フィールド ラベル、データ タイプでフィールドを検索することができます。

フィールドの全リストを表示するには、未使用のフィールドを表示 をクリックします。 以下のビデオのデモンストレーションをご参照ください。

フィールドを編集し、カスタム エイリアスを作成するためのガイドライン

  • フィールドのほとんどの属性を編集することができます。
  • 名前とデフォルトのエイリアスを編集することはできません。抽出に役立つように、ドキュメント オートメーション がデフォルトのエイリアス (ハードコードされたキーワード) を標準フィールドに割り当てます。
  • デフォルト エイリアスを変更または削除することはできませんが、カスタム エイリアス フィールドにエイリアスを追加できます。

    以下のビデオで、カスタム エイリアス作成のデモをご覧ください。

フォームとテーブル フィールドの考慮事項

以下の表には、説明で指定するすべてのフィールド名と必要値がリストされています。
オプション 説明
フィールド名 アルファベット文字 (A~Z または a~z) で始まるフィールド名を入力します。

標準フィールドでは、フィールド名はハードコードされているため変更できません。

フィールド ラベル 検証者にとってわかりやすい名前を入力します。

たとえば、組織の税番号VAT 番号などのローカライズされた名前に変更できます。

フィールド ラベルは抽出に影響しません。

信頼度 誤検出の可能性を低減するためのしきい値を設定します。

処理時に、ドキュメント オートメーション エンジンはドキュメントの各フィールドにスコアを割り当て、データが正しく抽出されたかどうかの確実度を示します。 信頼度しきい値よりも低いスコアのフィールドがドキュメントに含まれている場合、ドキュメントは検証キューに送信されます。

高い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が多くなります。 低い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が少なくなります。

1 から 100 までの値がサポートされます。

データタイプ 次のデータタイプから選択します。
  • 住所*: ドキュメントから住所フィールドを抽出する必要があるときに、このデータ型を使用してください。 システムはさまざまな住所フィールドを抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書から住所を検出して抽出するよう指示します。
  • テキスト: ドキュメントからテキストフィールドを抽出する必要があるときに、このデータ型を使用してください。 システムはさまざまなテキストフィールドを抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書からテキストを検出して抽出するよう指示します。
  • 数値: ドキュメントから数値フィールドを抽出する必要があるときに、このデータ型を使用してください。 システムはさまざまな数値フィールドを抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書から数値を検出して抽出するよう指示します。
  • 日付: ドキュメントから日付フィールドを抽出する必要があるときに、このデータ型を使用してください。 システムはさまざまな日付形式を抽出するようにトレーニングされており、このデータタイプを使用することで、システムに文書から日付を検出して抽出するよう指示します。

フィールドのデータがデータ タイプと一致しない場合、ドキュメントは検証キューに送られます。

ドキュメント オートメーションは、日付フォーマットと数字フォーマットのバリエーションをサポートしています。

* ユーザー定義のドキュメント タイプでラーニングインスタンスを設定している場合、フォーム フィールドには、アドレスの構造全体を抽出するアドレス データ タイプが含まれます。

日付/数字のフォーマット 抽出された日付や数字を特定のフォーマットに変換するための標準的な外観を設定します。 これにより、データベースやその他の記録システムの一貫性と正確性が確保されます。

たとえば、日付を MM/DD/YYYY に標準化するように選択し、処理されたドキュメントに 12 Feb 2023 と表示される日付が含まれる場合、ラーニングインスタンスによって、日付の形式が 02/12/2023 に変換されます。

英語 (米国) のロケールに数字を標準化することを選択し、処理されたドキュメントに 100,00 という数字が含まれている場合、ラーニングインスタンスが数字を 100.00 に再フォーマットします。

必須 以下のいずれかを選択します。
  • 必須: フィールドは空にできません。
  • 任意: フィールドは空にできます。または、ドキュメントに存在しなくてもかまいません。
検証フィードバックを活用して精度を向上させる フィールドの検証フィードバックを無効または有効にする。 ラーニングインスタンスの作成ページで検証を使用して精度を向上させるオプションを選択すると、このオプションはデフォルトですべてのフィールドに対して有効になります。 このオプションが有効になっている場合、フィールドに提供される検証フィードバックはデータ抽出の精度を向上させるために使用されます。 ただし、フィールドの値が検証フィードバックを必要とせずに要件に従って抽出されている場合や、データ抽出を改善するために事前トレーニングされたモデルや 生成 AI プロバイダーなどの代替ソリューションを使用する必要がある場合は、このオプションのチェックボックスをオフにしてフィールドの検証フィードバックを無効にすることができます。
注:
  • 検証フィードバックは学習インスタンスレベルでのみロックでき、フォームおよびテーブルフィールドでは利用できません。
  • 学習インスタンスレベルで検証フィードバックがロックされると、フィールドレベルの検証フィードバックオプションは読み取り専用モードに設定されます。これは、システムがデータの正確性を向上させるための検証フィードバックを考慮しないためです。 フィールドレベルの検証を編集するには、学習インスタンスの検証ロックを無効にする必要があります。
  • テーブルフィールドの検証フィードバックを無効にすると、そのようなフィールドは詳細トレーニング設定オプションに表示されません。 たとえば、詳細トレーニング設定で主列として列「Quantity」を選択したい場合、このテーブルフィールドの検証フィードバックが無効になっていると、「Quantity」列は主列リストに表示されません。
デフォルト エイリアス このフィールドに対してアクションは必要ありません。抽出に役立つように、ドキュメント オートメーション がデフォルトのエイリアス (ハードコードされたキーワード) を標準フィールドに割り当てます。
カスタム エイリアス ドキュメント オートメーション がフィールドを特定するのに役立つキーワードを追加します。 たとえば、VAT 番号 などのフィールドの国または地域固有の名前を、組織の税番号 カスタム フィールドのエイリアスとして追加します。 一意のカスタム エイリアスは、最大 30 個まで追加できます。
注: カスタム エイリアスは一意でなければなりません。 別のフィールドのデフォルト エイリアスと重複することはできません。 例外: フォーム フィールドは、テーブル フィールドと重複するカスタム エイリアスを持つことができ、その逆も可能です。
検証ルール データ タイプに応じて、パターン、数式、リスト、「starts or ends with」などのステートメントを使用してルールを作成します。

公式の検証 | 正規表現パターン検証

ラーニングインスタンスでカスタムマルチテーブルを作成または編集するためのガイドライン

学習インスタンスレベルでマルチテーブルを作成または編集する際は、以下の点を考慮してください。
  • この機能は、Automation Anywhere(事前トレーニング済み)、Automation Anywhere(ユーザー定義)、IQ Bot から ドキュメント オートメーション ブリッジ パッケージ、および非構造化 (生成 AI) のようなドキュメントタイプに適用されます。
  • 一度に1つのテーブルフィールドでルールを設定でき、異なるテーブルに属するフィールドをまたいで設定することはできません。
  • すべてのフィールド名は一意である必要があります。
  • 詳細トレーニング設定 はマルチテーブルに適用されます。 テーブル単位で機能し、テーブルをまたがっては機能しません。
  • マルチテーブルを含むラーニングインスタンスをインポート、エクスポート、コピーすることができます。
  • 学習インスタンスで作成されたカスタムテーブルは削除できますが、デフォルトのtableは削除できません。
  • カスタムマルチテーブル名の最大文字数は50文字、カラム名の最大文字数は200文字です。
  • table name フィールドには、英数字、アンダースコア、スペース、およびハイフン文字のみが許可されています。
  • ラーニングインスタンスを作成または編集しているときに、テーブル名を変更することはできません。
  • マルチテーブルサポートは 標準フォームGoogle Document AI、船荷証券、運送状、到着通知、およびパッキングリストの文書タイプには適用されません。
  • 出力 (CSV) ファイルには、table_name: field name 形式で、すべてのテーブル参照 (デフォルトおよびカスタムのマルチテーブル) が示されます。

Bot 出力ファイルとフォルダー構造

新しいラーニングインスタンスが作成されると、Control Roomオートメーション > Document Workspace フォルダー内にラーニングインスタンスと同じ名前のフォルダーを作成します。 このフォルダーには、2 つの Bots (抽出とダウンロード)、プロセス、フォームが含まれています。
ラーニングインスタンス アセットのスクリーンショット例
  • プロセス: ドキュメント オートメーション がアップロードされたドキュメントからデータを抽出し、検証のためにドキュメントをユーザーに割り当て、抽出されたデータをダウンロードする、if/else シナリオを使用してプロセスを管理します。 詳細については、「ビジネスユーザー向け Automation Co-Pilotのプロセスドキュメント オートメーション」をご参照ください。
  • 抽出 Bot: アップロードされたドキュメントの定義済みフィールドからデータを抽出します。
  • Botをダウンロード: 抽出されたデータをデバイスまたは共有ネットワーク上の特定のフォルダーにダウンロードします。
  • フォーム: プロセスに送信される入力パラメーターを定義します。 入力パラメーターには、ラーニングインスタンス名、アップロードしたファイル、および出力ファイル パスが含まれます。