Automation 360

Google Custom Document Extractor (CDE) のドキュメントオートメーションサポート

PDF としてダウンロード

コンテンツ

Google Custom Document Extractor (CDE) のドキュメントオートメーションサポート

PDF としてダウンロード

最終更新日2024/10/31

Automation 360

Document Automationで、ユーザーがトレーニング済みのラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出できます。

この新機能は、Google Custom Document Extractor (CDE) を使用したモデルのトレーニングに利用でき、あらゆるドキュメントタイプに対応し、50 種類の言語に対応しています。モデルが展開された後に、プロセッサーの URL を Document Automationの抽出処理に埋め込むことができます。

Google CDE を利用するには、以下のものが必要です。

Google Document AI workbench の Google サブスクリプション。
Document AI Editor という、プロセッサーを作成するためのロールが割り当てられ、Google Cloud Platform にサービスアカウントが作成されていること。「Create service accounts」および「IAM roles for Document AI」を参照してください。
[Document Automation Platform] > [Document Workspace] ページのライセンス

注: Google CDE の API URL 信頼済みリストを取り扱う場合は、すべての API を Bot Agent マシンの信頼済みリストに追加する必要があります。Google CDE で許可されている API のリストは、次のとおりです。

Google アカウント
Google OAuth
Google APIS

プロセッサーエンドポイント (信頼済みリストに追加されるホストのみ)

例:

https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process

Google CDE の使用方法

Google CDE でモデルを作成および管理する作業は、以下のようなさまざまなシナリオによって正当化されます。

言語サポートの拡大: 追加の言語のサポートが必要なドキュメントを扱う際に、既存の学習済みモデルがその機能を提供しない場合、Google CDEが不可欠となります。
サポートされている言語については、「Google CDE の言語サポート」を参照してください。
サポートされていないドキュメントフォーマット: Google CDE は、互換性のあるパーサーを持たないドキュメントタイプを扱う場合に有効です。
精度とパフォーマンスの課題への対応: 特定のドキュメントフォーマットでは、事前にトレーニングされたモデルを使用しても、望ましい精度を達成することが困難な場合があります。文書に関する特別なトレーニングを行った Google CDE は、より高い精度を提供できます。
カスタムまたは非標準のフィールド抽出：Google CDE は、カスタムまたは非標準のフォーマットのドキュメントから固有のフィールドを抽出する必要があるシナリオで使用することができます。
ラベルが存在しない場合の特定のトレーニングに基づく抽出: Google CDE は、あらかじめ定義されたラベルが存在しないフィールドから情報を抽出する必要がある場合に有効です。

Automation 360

Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート

Google CDE の使用方法

Google Custom Document Extractor (CDE) のドキュメントオートメーションサポート