Google CDE を使用したラーニングインスタンスの作成

ラーニングインスタンスは、ドキュメント タイプ、言語、抽出するフィールドなどの情報を保持する構造です。カスタム抽出プロセッサーを作成した後、ドキュメントからデータを抽出するためのラーニングインスタンスを作成する必要があります。

前提条件

  • Google Custom Document Extractor (CDE) プロセッサーの作成とトレーニングが正常に完了していることを確認します。
  • Control Room に Document Workspace (ページ数) 製品ライセンスがあることを確認します。
  • BYOK が設定されていることを確認します。詳細については、「Google CDE の BYOK (Bring Your Own Key) を設定する」を参照してください。

新しいプロセッサーを Google Document AI と統合するための重要なステップは、ラーニングインスタンスの作成です。これには、プロバイダーを [Google Document AI (ユーザー定義)] オプションとして利用することが含まれます。このオプションを使用してラーニングインスタンスを作成することで、ユーザーはプロセッサーに存在する名前と同一の名前でフォームとテーブルのフィールドを定義できます。
注:
  • 現在、Google Document AI では単一テーブル抽出がサポートされています。
  • チェックボックス機能 (プレビュー モード内) で、チェックボックス フィールドの抽出に一貫性がなく、結果に矛盾が生じるおそれがあります。このように、システムがチェックボックスのフィールド値を正確に抽出できない場合は、[未検出] というラベルが表示されます。

手順

  1. Control Room ホームページから、[マネージ] > [ラーニングインスタンス] > [ラーニングインスタンスの作成] に移動します。
    [ラーニングインスタンスを作成] ウィンドウが新しいタブで開きます。
  2. 作成する新しいラーニングインスタンスの名前を追加します。
  3. [ドキュメント タイプ] ドロップダウン メニューから、[ユーザー定義] を選択します。
  4. [プロバイダ] メニューから、[Google Document AI (ユーザー定義)] を選択します。
  5. [テーブル] または [フォーム] フィールドを選択します。
  6. Google CDE プロセッサーで使用されている名前と同一の名前で新しいフィールドを作成します。
    注: 新しいフィールドを作成するときは、その名前が Google プロセッサーで使用されているスキーマ ラベルと一致していることを確認してください。これは、フォーム フィールドとテーブル フィールドの両方に適用されます。
  7. [作成] をクリックします。

    新しいラーニングインスタンスが作成されると、[オートメーション] > [Document Workspace] フォルダー内のラーニングインスタンスと同じ名前のフォルダーが、Control Room によって作成されます。

  8. ラーニングインスタンスの抽出 Bot を、サービス アカウントとプロセッサー エンドポイント URL で更新します。
    1. Bots > IQ Bot プロセス > {LI 名} > {LI 名}_extractionbot からラーニングインスタンスの Bot を開きます。
    2. 資格情報コンテナのロッカーとキーを選択します。詳細については、「Google CDE の BYOK (Bring Your Own Key) を設定する」を参照してください。
    3. Google CDE プロセッサーから予測エンドポイント URL をコピーします。
      Google Document AI の予測エンドポイント
    4. コピーした URL を [ドキュメント プロセッサーの Document AI エンドポイント URL] に貼り付けます。

      ドキュメント プロセッサーの Document AI エンドポイント URL

次のステップ

ドキュメントをラーニングインスタンスにアップロードし、検証エラーを修正して、抽出したデータを確認します。詳細については、「Document Automation でのドキュメントの処理」を参照してください。