Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート

ドキュメント オートメーションで、ユーザーがトレーニング済みのラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出できます。

この新機能は、Google Custom Document Extractor (CDE) を使用したモデルのトレーニングに利用でき、あらゆるドキュメント タイプに対応し、50 種類の言語に対応しています。モデルが展開された後に、プロセッサーの URL を ドキュメント オートメーションの抽出処理に埋め込むことができます。

Google CDE を利用するには、以下のものが必要です。
  • Google Document AI workbench の Google サブスクリプション。
  • Document AI Editor という、プロセッサーを作成するためのロールが割り当てられ、Google Cloud Platform にサービス アカウントが作成されていること。「Create service accounts」および「IAM roles for Document AI」を参照してください。
  • [Document Automation Platform] > [Document Workspace] ページのライセンス
注: Google CDE の API URL 信頼済みリストを取り扱う場合は、すべての API を Bot エージェント マシンの信頼済みリストに追加する必要があります。Google CDE で許可されている API のリストは、次のとおりです。
  • Google アカウント
  • Google OAuth
  • Google APIS
  • プロセッサー エンド ポイント (信頼済みリストに追加されるホストのみ)
    例:
    https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process

Google CDE の使用方法

Google CDE でモデルを作成および管理する作業は、以下のようなさまざまなシナリオによって正当化されます。
  • 言語サポートの拡大: 追加の言語のサポートが必要なドキュメントを扱う際に、既存の学習済みモデルがその機能を提供しない場合、Google CDEが不可欠となります。

    サポートされている言語については、「Google CDE の言語サポート」を参照してください。

  • サポートされていないドキュメント フォーマット: Google CDE は、互換性のあるパーサーを持たないドキュメント タイプを扱う場合に有効です。
  • 精度とパフォーマンスの課題への対応: 特定のドキュメント フォーマットでは、事前にトレーニングされたモデルを使用しても、望ましい精度を達成することが困難な場合があります。文書に関する特別なトレーニングを行った Google CDE は、より高い精度を提供できます。
  • カスタムまたは非標準のフィールド抽出:Google CDE は、カスタムまたは非標準のフォーマットのドキュメントから固有のフィールドを抽出する必要があるシナリオで使用することができます。
  • ラベルが存在しない場合の特定のトレーニングに基づく抽出: Google CDE は、あらかじめ定義されたラベルが存在しないフィールドから情報を抽出する必要がある場合に有効です。