Google Document AI を使用してデータを抽出する

ラーニングインスタンスの抽出Botにおいて、Google DocAI の設定を構成して、独自のライセンス (BYOL) を使用します。

前提条件

  • Google サービス アカウントの Control Room に対してサービス アカウント キーが構成されていることを確認してください。 Google CDE の BYOK (Bring Your Own Key) を設定するを参照してください。
  • ドキュメントプロセッサのエンドポイントURLをメモしておくことを確認してください。 エンドポイントのURLは次の形式です: https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:fetchProcessorTypes. Create a service account keyを参照してください。

    Google Cloud Document AI プロセッサの概要ページが予測エンドポイントの URL を表示しています

  • Google Cloud ストレージを使用する予定がある場合は、Cloud Storage バケット名をメモしておくことを確認してください。 About Cloud Storage buckets を参照してください。

    Google Cloud ストレージ バケットのリスト サンプル名

手順

  1. サービス アカウント オプションで、Google Document AI セキュリティ トークンを含むライセンス資格情報を入力します。 独自の資格情報を使用しない場合は、なし オプションを選択します。 資格情報変数安全でない文字列 オプションを使ってサービス アカウントの資格情報を入力します。
  2. ドキュメントプロセッサのエンドポイントURLオプションに、サービスアカウントのURLを入力してください。
  3. オプション: Cloud Storage バケット名(任意) オプションに、クラウド ストレージバケット名を入力します。 10 ページ以上のドキュメントがある場合、入力ファイルと抽出結果は一時的にこのバケットに保存されます。