Automation 360

Document Automationにラーニングインスタンスを作成

PDF としてダウンロード

コンテンツ

Document Automationにラーニングインスタンスを作成

PDF としてダウンロード

最終更新日2025/08/22

Document Automationにラーニングインスタンスを作成

サポートされているさまざまなドキュメントタイプからデータを抽出するためのラーニングインスタンスを作成することで、ドキュメントの処理を開始します。ラーニングインスタンスは、ドキュメントタイプ、言語、抽出するフィールドなどの情報を保持する構造です。

前提条件

ラーニングインスタンスを作成するには、Learning instance creator ユーザーでなければなりません。 [Document Automation 人のユーザー]を参照してください。
OCR をサポートするドキュメントタイプの場合、デフォルトの OCR は ABBYY FineReader エンジンです。または、Google Vision OCR を使用してドキュメントを処理するラーニングインスタンスを作成できます。
標準フォームドキュメントタイプの場合は、カスタム抽出モデルを作成したことを確認してください。 [標準フォームでカスタム抽出モデルを作成]を参照してください。

ラーニングインスタンスを作成するための完全なエンドツーエンドプロセスについては、このビデオをご覧ください。

手順

Control Room ホームページから、 AI > ドキュメントオートメーションに移動し、 [ラーニングインスタンスを作成] をクリックします。
ラーニングインスタンスの名前と説明を入力します。
Document Automation では、重複したラーニングインスタンス名を使用できないため、一意の名前を指定する必要があります。
適切なドキュメントタイプを選択します。

注: ユーザー定義のドキュメントタイプを使用して、請求書と外観が似ていて、発注書や受注書などのキー値ペアとテーブル構造を含むドキュメントを処理します。このドキュメントタイプでは、すべてのフォームとテーブルのフィールドを作成し、設定します。
言語を選択します。
でサポートされている言語の詳細については、[Document Automation]を参照してください。Document Automationでサポートされている言語
ステップ 3 でパーサーを構成する際に使用するドキュメントタイプを選択すると、パーサーの構成時に選択した言語が自動的に選択されます。さらに、ロケールリストには、自動選択された言語に基づいた言語オプションが表示されます。
プロバイダーを選択します。
ステップ 4 で英語を選択した場合、 Automation Anywhere (トレーニング済み) が自動で選択されます。
ステップ 3 でパーサーを設定する際に使用するドキュメントタイプを選択すると、構成した (サードパーティの) パーサーがプロバイダーとして自動的に選択されます。
オプション: OCR プロバイダーを選択します。
以下のオプションから選択できます。
- ABBYY
- Google Vision
- デジタル PDF 抽出ツール
  
  注: デジタルPDF抽出ツールオプションは、デジタルPDFからデータを抽出する場合のみに使用し、スキャンした文書や画像からは使用しないでください。
デフォルトでは、Document Automationは ABBYY FineReader エンジンを使用してドキュメントを処理します。

クラウド Control Room を使用しているユーザーは、Google Vision OCR または Digital PDF Extractor を使用してドキュメントを処理するように選択できます。
オプション: [検証を使用して精度を改善] オプションを使用すると、抽出結果を改善するためにフィードバックをシステムに送信することができます。詳細については、[検証による抽出精度の向上]を参照してください。
注:
- [検証を使用して精度を改善] オプションは、選択したドキュメントタイプでのみ使用できます。
- 検証を使用して精度を改善オプションは、生成 AI モデルの検索クエリ機能で提供されたユーザープロンプトを使用してデータ抽出を改善します。 [Document Automation - 生成 AI を使用したデータ抽出]を参照してください。
オプション: 機能を使用して抽出するには、[生成 AI によるデータ抽出] オプションを選択し生成 AIます。詳細については、[Document Automation - 生成 AI を使用したデータ抽出]を参照してください。
次のいずれかの生成 AI プロバイダーを選択します。
注:
- 生成AI駆動のデータ抽出オプションを使用するには、ドキュメント抽出パッケージバージョン3.31.16以降を使用していることを確認してください。 [ドキュメント抽出パッケージの更新]を参照してください。
- [生成 AI によるデータ抽出] オプションは、選択したドキュメントタイプでのみ使用できます。一部のドキュメントタイプでは、[生成 AI によるデータ抽出] オプションはデフォルトで有効になっており、無効にすることはできません。このようなドキュメントタイプに対してのみ生成 AI プロバイダーを選択できます。
- 以前のリリースから v.33 以降に更新すると、Open AI がデフォルトのデータ抽出プロバイダーとして設定されます。
- ラーニングインスタンスに Anthropic プロバイダーを選択し、Anthropic 設定を誤って構成した場合、または対応する抽出 Bot で異なるプロバイダーを選択した場合、ドキュメントを処理する際にエラーが表示されます。
- OpenAI を使用してドキュメントを処理した後、Anthropic に切り替えてデータを抽出する場合、Anthropic への切り替え後に処理されるドキュメントのみが、データ抽出に Anthropic を使用します。以前に処理されたドキュメントについては、抽出されたデータは OpenAI を使用します。
- Open AI: OpenAI は、コンテンツ生成、要約、画像理解、意味検索、自然言語からコードへの翻訳を実行する Open AI の強力な言語モデルにアクセスできます。このプロバイダーは、組み込みライセンス (追加ライセンスを必要としない) および BYOL (Bring Your Own License) で利用可能です。 BYOL を使用している場合、抽出 OpenAIでBot用の追加設定を構成して、このプロバイダーを使用するようにしてください。 [データの抽出アクション]を参照してください。
- Anthropic: Anthropicや GCP で利用可能な生成 AI AWS モデルを、Document Automationでのデータ抽出に使用できるようになりました。このオファリングにより、御社が認定した生成 AI プロバイダーに応じて、クラウドモデルを柔軟に選択することができます。
  Anthropic は、以下のメリットを提供します。
  - 大規模な非構造化ドキュメントを効率的に処理する
  - 英語と他の言語の両方のドキュメントを処理できる
  - データ抽出の精度が向上し、ドキュメントの処理が高速化する
  BYOL を使用している場合、このプロバイダーを使用するには、Anthropic Claude または Google Vertex AI サービスで Amazon Bedrock モデルを構成し、抽出 Bot で追加設定を構成する必要があります。 [データの抽出アクション]を参照してください。
[次へ] をクリックします。

フォームおよびテーブルフィールドを構成するときは、サンプルドキュメントを Control Room ウィンドウと並べて開くことをお勧めします。

注:

フォームフィールドは、ドキュメントに 1 回だけ出現するフィールドのタイプです。
テーブルフィールドとは、ドキュメント中に繰り返し出現するフィールドのタイプで、通常はテーブルの形で出現します。

抽出するフォームフィールドとテーブルフィールドを構成します。詳細については、[フィールドの表示と検索]を参照してください。
1. フィールドをクリックすると、フィールドエディターが開きます。詳細については、[フィールドを編集し、カスタムエイリアスを作成するためのガイドライン]を参照してください。
2. フィールドの右側にあるメニューアイコンにマウスカーソルを合わせて、上下矢印を表示します。
3. 矢印を使用してフィールドの順序を並べ替えて、より効率的に手動検証を行うことができます。
  フィールドの順序は抽出に影響しません。
他のフィールド属性については、[フォームとテーブルフィールドの考慮事項]を参照してください。
[フィールドの追加] をクリックし、フィールド名、フィールドラベル、信頼度、データタイプ、日付/数値のフォーマットなどのフィールドの詳細を指定します。詳細については、[フォームとテーブルフィールドの考慮事項]を参照してください。

注: 生成 AI駆動のデータ抽出}オプションを選択した場合、学習インスタンスを作成する際に、期待される結果を得るためにフィールドに適切なプロンプトを追加することをお勧めします。 [Document Automation - 生成 AI を使用したデータ抽出]を参照してください。
次の画像は、ラーニングインスタンスに設定されたフォームとテーブルフィールドを示しています。

注: [フィールドを追加] オプションは、[領収書] ドキュメントタイプでは使用できません。
オプション: [テーブルフィールド] タブで、[+] アイコンをクリックして、ラーニングインスタンスレベルでカスタムテーブルを追加します。
1. テーブルの名前を入力します。
2. オプション: データを抽出したい文書内のテーブルの詳細を説明するプロンプトを入力してください。例えば、ドキュメントに同一のヘッダーを持つ複数のテーブルが含まれていて、異なるタイトルが付けられている場合、プロンプトで正確なテーブルタイトルを指定することで、正しいテーブルからデータが抽出されることを保証できます。
  テーブルプロンプトを更新するには、テーブル編集 () アイコンをクリックし、プロンプトを更新して、更新をクリックします。
3. [追加] をクリックします。
4. [フィールドの追加] をクリックし、フィールド名、フィールドラベル、信頼度、データタイプ、日付/数値のフォーマットなどのフィールドの詳細を指定します。詳細については、[フォームとテーブルフィールドの考慮事項]を参照してください。
  
  注: また、ラーニングインスタンスの編集中にカスタムテーブルを追加および削除することもできます。
カスタムテーブルは [テーブル] ドロップダウンリストに表示されます。

また、[ドキュメントルール] タブでカスタムテーブルとデフォルトテーブルのフィールドを表示することもできますが、すべての異なるテーブルにわたりフィールドを選択することはできません。複数のテーブルサポートの詳細については、[ラーニングインスタンスでカスタムマルチテーブルを作成または編集するためのガイドライン]を参照してください。
[作成] をクリックします。

新しいラーニングインスタンスが作成されると、Control Room によってオートメーション > ドキュメントワークスペースプロセスフォルダー内のラーニングインスタンスと同じ名前のフォルダーが作成されます。このフォルダーには、2 つの Bot (抽出とダウンロード)、プロセス、フォームが含まれています。詳細については、[Bot 出力ファイルとフォルダー構造]を参照してください。

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します (Document Automation でのドキュメントの処理)。

Automation 360