Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート
- 最終更新日2023/10/03
Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート
Document Automationで、ユーザーがトレーニング済みのラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出できます。
この新機能は、Google Custom Document Extractor (CDE) を使用したモデルのトレーニングに利用でき、あらゆるドキュメント タイプに対応し、50 種類の言語に対応しています。モデルが展開された後に、プロセッサーの URL を Document Automationの抽出処理に埋め込むことができます。
Google CDE を利用するには、以下のものが必要です:
- Google Document AI workbench の Google サブスクリプション。
- のライセンス
Google CDE の使用方法
Google CDE でモデルを作成および管理する作業は、以下のようなさまざまなシナリオによって正当化されます。
- 言語サポートの拡大: 追加の言語のサポートが必要なドキュメントを扱う際に、既存の学習済みモデルがその機能を提供しない場合、Google CDEが不可欠となります。
- サポートされていないドキュメント フォーマット: Google CDE は、互換性のあるパーサーを持たないドキュメント タイプを扱う場合に有効です。たとえば、船荷証券のようなドキュメント、 KYC ドキュメント、既存のパーサーが活用できないその他のドキュメントなどです。
- 精度とパフォーマンスの課題への対応: 特定のドキュメント フォーマットでは、事前にトレーニングされたモデルを使用しても、望ましい精度を達成することが困難な場合があります。文書に関する特別なトレーニングを行った Google CDE は、より高い精度を提供できます。
- カスタムまたは非標準のフィールド抽出:Google CDE は、カスタムまたは非標準のフォーマットのドキュメントから固有のフィールドを抽出する必要があるシナリオで使用することができます。
- ラベルが存在しない場合の特定のトレーニングに基づく抽出: Google CDE は、あらかじめ定義されたラベルが存在しないフィールドから情報を抽出する必要がある場合に有効です。