Google Custom Document Extractor (CDE) のドキュメント オートメーション サポート

Document Automationで、ユーザーがトレーニング済みのラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出できます。

この新機能は、Google Custom Document Extractor (CDE) を使用したモデルのトレーニングに利用でき、あらゆるドキュメント タイプに対応し、50 種類の言語に対応しています。モデルが展開された後に、プロセッサーの URL を Document Automationの抽出処理に埋め込むことができます。

Google CDE を利用するには、以下のものが必要です:
  • Google Document AI workbench の Google サブスクリプション。
  • [Document Automation Platform] > [Document Workspace] ページのライセンス

Google CDE の使用方法

Google CDE でモデルを作成および管理する作業は、以下のようなさまざまなシナリオによって正当化されます。
  • 言語サポートの拡大: 追加の言語のサポートが必要なドキュメントを扱う際に、既存の学習済みモデルがその機能を提供しない場合、Google CDEが不可欠となります。
  • サポートされていないドキュメント フォーマット: Google CDE は、互換性のあるパーサーを持たないドキュメント タイプを扱う場合に有効です。たとえば、船荷証券のようなドキュメント、 KYC ドキュメント、既存のパーサーが活用できないその他のドキュメントなどです。
  • 精度とパフォーマンスの課題への対応: 特定のドキュメント フォーマットでは、事前にトレーニングされたモデルを使用しても、望ましい精度を達成することが困難な場合があります。文書に関する特別なトレーニングを行った Google CDE は、より高い精度を提供できます。
  • カスタムまたは非標準のフィールド抽出:Google CDE は、カスタムまたは非標準のフォーマットのドキュメントから固有のフィールドを抽出する必要があるシナリオで使用することができます。
  • ラベルが存在しない場合の特定のトレーニングに基づく抽出: Google CDE は、あらかじめ定義されたラベルが存在しないフィールドから情報を抽出する必要がある場合に有効です。