Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート
- 最終更新日2024/10/31
Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート
ドキュメント オートメーションで、ユーザーがトレーニング済みのラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出できます。
この新機能は、Google Custom Document Extractor (CDE) を使用したモデルのトレーニングに利用でき、あらゆるドキュメント タイプに対応し、50 種類の言語に対応しています。モデルが展開された後に、プロセッサーの URL を ドキュメント オートメーションの抽出処理に埋め込むことができます。
Google CDE を利用するには、以下のものが必要です。
- Google Document AI workbench の Google サブスクリプション。
- Document AI Editor という、プロセッサーを作成するためのロールが割り当てられ、Google Cloud Platform にサービス アカウントが作成されていること。「Create service accounts」および「IAM roles for Document AI」を参照してください。
- のライセンス
注: Google CDE の API URL 信頼済みリストを取り扱う場合は、すべての API を Bot エージェント マシンの信頼済みリストに追加する必要があります。Google CDE で許可されている API のリストは、次のとおりです。
- Google アカウント
- Google OAuth
- Google APIS
- プロセッサー エンド ポイント (信頼済みリストに追加されるホストのみ)例:
https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process
Google CDE の使用方法
Google CDE でモデルを作成および管理する作業は、以下のようなさまざまなシナリオによって正当化されます。
- 言語サポートの拡大: 追加の言語のサポートが必要なドキュメントを扱う際に、既存の学習済みモデルがその機能を提供しない場合、Google CDEが不可欠となります。
サポートされている言語については、「Google CDE の言語サポート」を参照してください。
- サポートされていないドキュメント フォーマット: Google CDE は、互換性のあるパーサーを持たないドキュメント タイプを扱う場合に有効です。
- 精度とパフォーマンスの課題への対応: 特定のドキュメント フォーマットでは、事前にトレーニングされたモデルを使用しても、望ましい精度を達成することが困難な場合があります。文書に関する特別なトレーニングを行った Google CDE は、より高い精度を提供できます。
- カスタムまたは非標準のフィールド抽出:Google CDE は、カスタムまたは非標準のフォーマットのドキュメントから固有のフィールドを抽出する必要があるシナリオで使用することができます。
- ラベルが存在しない場合の特定のトレーニングに基づく抽出: Google CDE は、あらかじめ定義されたラベルが存在しないフィールドから情報を抽出する必要がある場合に有効です。