ドキュメント オートメーションでラーニングインスタンスを作成する際の考慮事項
- 最終更新日2024/12/09
ドキュメント オートメーションでラーニングインスタンスを作成する際の考慮事項
ラーニングインスタンスを作成するときは、フォームとテーブル フィールド、検索フィールド、ラーニングインスタンス作成後の出力フォルダーに関する追加情報などについて、次の考慮事項に留意してください。
フィールドの表示と検索
ドキュメント オートメーション には、フォームおよびテーブル フィールドの標準セットが用意されていますが、その多くは初期状態では表示されません。 フィールド名、フィールド ラベル、データ タイプでフィールドを検索することができます。
フィールドの全リストを表示するには、未使用のフィールドを表示 をクリックします。 以下のビデオのデモンストレーションをご参照ください。
フィールドを編集し、カスタム エイリアスを作成するためのガイドライン
- フィールドのほとんどの属性を編集することができます。
- 名前とデフォルトのエイリアスを編集することはできません。抽出に役立つように、ドキュメント オートメーション がデフォルトのエイリアス (ハードコードされたキーワード) を標準フィールドに割り当てます。
- デフォルト エイリアスを変更または削除することはできませんが、カスタム エイリアス フィールドにエイリアスを追加できます。
以下のビデオで、カスタム エイリアス作成のデモをご覧ください。
フォームとテーブル フィールドの考慮事項
オプション | 説明 |
---|---|
フィールド名 | アルファベット文字 (A~Z または a~z) で始まるフィールド名を入力します。 標準フィールドでは、フィールド名はハードコードされているため変更できません。 |
フィールド ラベル | 検証者にとってわかりやすい名前を入力します。 たとえば、組織の税番号を VAT 番号などのローカライズされた名前に変更できます。 フィールド ラベルは抽出に影響しません。 |
信頼度 | 誤検出の可能性を低減するためのしきい値を設定します。 処理時に、ドキュメント オートメーション エンジンはドキュメントの各フィールドにスコアを割り当て、データが正しく抽出されたかどうかの確実度を示します。 信頼度しきい値よりも低いスコアのフィールドがドキュメントに含まれている場合、ドキュメントは検証キューに送信されます。 高い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が多くなります。 低い信頼度しきい値を入力すると、検証キューに送信されるドキュメントの数が少なくなります。 1 から 100 までの値がサポートされます。 |
データタイプ | 次のデータタイプから選択します。
フィールドのデータがデータ タイプと一致しない場合、ドキュメントは検証キューに送られます。 ドキュメント オートメーションは、日付フォーマットと数字フォーマットのバリエーションをサポートしています。* ユーザー定義のドキュメント タイプでラーニングインスタンスを設定している場合、フォーム フィールドには、アドレスの構造全体を抽出するアドレス データ タイプが含まれます。 |
日付/数字のフォーマット | 抽出された日付や数字を特定のフォーマットに変換するための標準的な外観を設定します。 これにより、データベースやその他の記録システムの一貫性と正確性が確保されます。 たとえば、日付を 英語 (米国) のロケールに数字を標準化することを選択し、処理されたドキュメントに |
必須 | 以下のいずれかを選択します。
|
検証フィードバックを活用して精度を向上させる | フィールドの検証フィードバックを無効または有効にする。 ラーニングインスタンスの作成ページで検証を使用して精度を向上させるオプションを選択すると、このオプションはデフォルトですべてのフィールドに対して有効になります。 このオプションが有効になっている場合、フィールドに提供される検証フィードバックはデータ抽出の精度を向上させるために使用されます。 ただし、フィールドの値が検証フィードバックを必要とせずに要件に従って抽出されている場合や、データ抽出を改善するために事前トレーニングされたモデルや 生成 AI プロバイダーなどの代替ソリューションを使用する必要がある場合は、このオプションのチェックボックスをオフにしてフィールドの検証フィードバックを無効にすることができます。 注:
|
デフォルト エイリアス | このフィールドに対してアクションは必要ありません。抽出に役立つように、ドキュメント オートメーション がデフォルトのエイリアス (ハードコードされたキーワード) を標準フィールドに割り当てます。 |
カスタム エイリアス |
ドキュメント オートメーション がフィールドを特定するのに役立つキーワードを追加します。 たとえば、VAT 番号 などのフィールドの国または地域固有の名前を、組織の税番号 カスタム フィールドのエイリアスとして追加します。 一意のカスタム エイリアスは、最大 30 個まで追加できます。 注: カスタム エイリアスは一意でなければなりません。 別のフィールドのデフォルト エイリアスと重複することはできません。 例外: フォーム フィールドは、テーブル フィールドと重複するカスタム エイリアスを持つことができ、その逆も可能です。
|
検証ルール | データ タイプに応じて、パターン、数式、リスト、「starts or ends with」などのステートメントを使用してルールを作成します。 |
ラーニングインスタンスでカスタムマルチテーブルを作成または編集するためのガイドライン
- この機能は、Automation Anywhere(事前トレーニング済み)、Automation Anywhere(ユーザー定義)、IQ Bot から ドキュメント オートメーション ブリッジ パッケージ、および非構造化 (生成 AI) のようなドキュメントタイプに適用されます。
- 一度に1つのテーブルフィールドでルールを設定でき、異なるテーブルに属するフィールドをまたいで設定することはできません。
- すべてのフィールド名は一意である必要があります。
- 詳細トレーニング設定 はマルチテーブルに適用されます。 テーブル単位で機能し、テーブルをまたがっては機能しません。
- マルチテーブルを含むラーニングインスタンスをインポート、エクスポート、コピーすることができます。
- 学習インスタンスで作成されたカスタムテーブルは削除できますが、デフォルトのtableは削除できません。
- カスタムマルチテーブル名の最大文字数は50文字、カラム名の最大文字数は200文字です。
- table name フィールドには、英数字、アンダースコア、スペース、およびハイフン文字のみが許可されています。
- ラーニングインスタンスを作成または編集しているときに、テーブル名を変更することはできません。
- マルチテーブルサポートは 標準フォーム、Google Document AI、船荷証券、運送状、到着通知、およびパッキングリストの文書タイプには適用されません。
- 出力 (CSV) ファイルには、table_name: field name 形式で、すべてのテーブル参照 (デフォルトおよびカスタムのマルチテーブル) が示されます。
Bot 出力ファイルとフォルダー構造
- プロセス: ドキュメント オートメーション がアップロードされたドキュメントからデータを抽出し、検証のためにドキュメントをユーザーに割り当て、抽出されたデータをダウンロードする、if/else シナリオを使用してプロセスを管理します。 詳細については、「ビジネスユーザー向け Automation Co-Pilotのプロセスドキュメント オートメーション」をご参照ください。
- 抽出 Bot: アップロードされたドキュメントの定義済みフィールドからデータを抽出します。
- Botをダウンロード: 抽出されたデータをデバイスまたは共有ネットワーク上の特定のフォルダーにダウンロードします。
- フォーム: プロセスに送信される入力パラメーターを定義します。 入力パラメーターには、ラーニングインスタンス名、アップロードしたファイル、および出力ファイル パスが含まれます。