Google Document AI の [抽出] アクションの使用

Bot がデータ抽出のためにドキュメントを Google Document AI に送信し、JSON フォーマットで出力を取得できるように、[抽出] アクションを構成します。

前提条件

Google Cloud アカウントにログインし、[プロセッサ] ページに移動してカスタム エンドポイントを取得します。「プロセッサ エンドポイントの使用」 を参照してください。

カスタム エンドポイントは次の形式に従っている必要があります。https://LOCATION-documentai.googleapis.com/API_VERSION/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID。この アクション を設定する場合、太字のパラメーターは必須です。

手順

  1. [Google Document AI] > [抽出] アクション をダブルクリックするか、ドラッグします。
  2. [ドキュメントのファイル パス] フィールドで、処理するドキュメントのファイル パスを指定します。
    注: この アクション を [ループ] アクション 内で使用してフォルダー内のすべてのドキュメントを処理する場合は、ファイル名を保持する変数と拡張子を保持する変数の間にピリオドを含めるようにしてください。たとえば、C:\Documents\$dictFile(name)$.$dictFile(extension)$ です。
  3. カスタム エンドポイントにある次の情報を指定します。
    • プロジェクト ID
    • プロセッサ ID
    • 場所
  4. [セッション名] フィールドには、[接続] アクション で Google サービス アカウントへの接続に使用したセッション名を入力します。
  5. オプション: 出力を保持する文字列変数を選択または作成します。
    アクション は JSON 形式のデータを返します。
  6. [保存] をクリックします。

次のステップ

[JSON] パッケージアクション を使用してデータを解析し、特定のノードから値を抽出できます。この方法の概要については、次の手順を参照してください。
  1. [セッションを開始] アクション で JSON セッションを開始します。[JSON テキスト] フィールドに、[抽出] アクション の出力を保持する文字列変数を挿入します。
  2. [ノード値の取得] アクション を使用して [Google Document AI] > [抽出] アクション の出力を解析し、ノード値をリスト変数に代入します。

    [ノード値の取得] アクション の後に [ループ] アクション を挿入すると、各リスト項目を反復処理して、各ノード値に対して操作を実行できます。

  3. [セッションの終了] アクション を使用して JSON セッションを終了します。