[データの抽出] アクション

Task Bot は [データの抽出] アクションを使用して、Document Automationにアップロードされたドキュメントを処理します。

ラーニングインスタンスをDocument Automationで作成する場合、Control Room は自動的に extractionbot を作成します。 この Bot を編集するには、[オートメーション] > [Document Workspace Processes] に移動し、ラーニングインスタンスと同じ名前のフォルダーを選択して、[extractionbot] を開きます。

次の表では、アクションの各フィールドについて説明します。
注:
  • プロセスを中断する可能性があるため、これらのフィールドの変数を変更することはお勧めしません。
  • 以下のBotアクション を作成し、Bot を実行するとエラーが表示されます。
    1. ドキュメントを分類するには、高度な分類子パッケージでドキュメントの分類アクションを使用します。
    2. ドキュメントからデータを抽出するには、アクションパッケージの [非構造化ドキュメント] タイプのラーニングインスタンスを使用しているデータ抽出ドキュメント抽出を使用します。

    したがって、同じ アクションアクション非構造化ドキュメント タイプのラーニングインスタンスを使用しているドキュメント分類Botとデータ抽出は使用しないことをお勧めします。

  • データ抽出 アクションIQ Bot Pre-processorドキュメント分類子、または OCR アクション と一緒に単一の Bot で使用すると、Bot が失敗します。 しかし、単一の IQ Bot Pre-processorドキュメント分類子OCR、および アクション を使用することができますBot

    回避策: Ensure that you create a separate Bot、、またはIQ Bot Pre-processorからのいずれかのアクションを使用する際には、必ず別のドキュメント分類子を作成し、OCRのExtract Data アクションを使用してくださいドキュメント抽出 パッケージ。 これらの Bots を順番に実行する必要がある場合は、これらの BotsAutomation Co-Pilot プロセスに含めてください。

フィールド 説明
抽出するドキュメント アップロードされたドキュメントのファイル パス。
ラーニングインスタンス名 この Bot に関連付けられているラーニング インスタンスの名前。
出力の結果 Document Automation データの保存場所を指定します。 事例に応じて、データをDocument Automation サーバーにアップロードするか、ローカル フォルダーに保存します。
  • サーバーにアップロード: 抽出中に生成されたデータは、さらに処理 (検証など) するためにサーバーにアップロードされ、後で Bot [データのダウンロード] を実行する アクション によってダウンロードされます。
  • ローカル フォルダーへ保存: Document Automationによって生成されたデータはサーバーに送信されず、指定されたフォルダー パスに保存されます。
    注: このオプションを選択すると、Document Automation はファイルを検証のために送信し、検証キューを増加させます。 しかし、関連するAutomation Co-Pilotリクエストがないため、Automation Co-Pilotバリデーターでドキュメントを表示することはできません。 また、このオプションを選択するとプロセス Bot でのそのステップが冗長になるため、プロセスから データのダウンロード アクション を実行する Bot を削除できます。
追加の設定 」を参照してください。
(任意) Save responses as record 宛先レコード変数に対して、次のいずれかのタブを選択します。
  • 複数の変数: キーと、そのキーがマッピングされる変数を指定することで、出力を複数の変数に格納します。 この変数は、次のタイプのいずれかになります。 [文字列]、[数字]、[日時]、[ブール] など。 たとえば、ソースのレコード変数に 2 つのエントリ (名前と連絡先番号) が含まれている場合は、次のように出力を格納することができます。
    キー 変数にマップする
    名前 StrName
    連絡先番号 MobileNo

    変数 StrNameMobileNo は、それぞれ文字列型変数と数字型変数です。

  • レコード: 出力をレコード型変数に格納します。 ドロップダウン メニューをクリックし、既存の変数を選択するか、作成します。

追加の設定

次の表は、デフォルト、Google Document AIMicrosoft OpenAI Anthropic IQ Bot などの追加設定をすべて データの抽出 アクション に示したものです。 外部サービス用に選択した設定のライセンス資格情報を入力する必要があります。

追加の設定 内容
なし これは extractionbot のデフォルトオプションです。 外部接続を使用したくない場合は、[なし] オプションを選択できます。
Google DocAI
  • サービス アカウント: Google Document AI セキュリティ トークンを含むライセンス資格情報入力します。 独自の資格情報を使用したくない場合は、[なし] オプションを選択します。 [資格情報]、[変数]、[安全でない文字列] オプションを使用して、サービス アカウントの資格情報を入力します。
  • ドキュメント プロセッサーのエンドポイント URL: サービス アカウントの URL を指定します。
  • クラウド ストレージのバケット名 (オプション): クラウド ストレージ バケット名を指定します。 10 ページ以上のドキュメントがある場合、入力ファイルと抽出結果は一時的にこのバケットに保存されます。
MS OpenAI
  • GPT のサービス アカウント: [資格情報]、[変数]、[安全でない文字列] オプションを使用して、クエリ用の AI セキュリティ トークンを含むライセンス資格情報を入力します。 独自の資格情報を使用したくない場合は、[なし] オプションを選択します。
  • GPT モデルのエンドポイント URL: ドキュメント処理のエンドポイントへの URL を指定します。 例えば、https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/chat/completions?api-version={api-version}です。
  • 埋め込み用のサービス アカウント: [資格情報]、[変数]、[安全でない文字列] オプションを使用して、埋め込み用の Microsoft OpenAI セキュリティ トークンを含むライセンス資格情報を入力します。 また、独自の資格情報を使用することもできます。
  • ADA モデルのエンドポイント URL: ドキュメント処理のエンドポイントへの URL を指定します。 例えば、https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/embeddings?api-version={api-version}
Anthropic Anthropic モデルを使用してデータを抽出する」を参照してください。
IQ Bot (オプション) グループ ラベル (オプション): ラーニングインスタンスが Automation 360 IQ Bot で作成され、Document Automationに接続されている場合、このフィールドには該当するドキュメント グループ名が自動入力 (変数) されます。