Google CDE を使用したラーニングインスタンスの作成
- 最終更新日2024/10/31
Google CDE を使用したラーニングインスタンスの作成
ラーニングインスタンスは、ドキュメント タイプ、言語、抽出するフィールドなどの情報を保持する構造です。 カスタム抽出プロセッサーを作成した後、ドキュメントからデータを抽出するためのラーニングインスタンスを作成する必要があります。
前提条件
- Google Custom Document Extractor (CDE) プロセッサーの作成とトレーニングが正常に完了していることを確認します。
- Control Room に Document Workspace (ページ数) 製品ライセンスがあることを確認します。
- BYOK が設定されていることを確認します。 詳細については、「Google CDE の BYOK (Bring Your Own Key) を設定する」を参照してください。
新しいプロセッサーを Google Document AI と統合するための重要なステップは、ラーニングインスタンスの作成です。 これには、プロバイダーを [Google Document AI (ユーザー定義)] オプションとして利用することが含まれます。 このオプションを使用してラーニングインスタンスを作成することで、ユーザーはプロセッサーに存在する名前と同一の名前でフォームとテーブルのフィールドを定義できます。
注:
- 現在、Google Document AI では単一テーブル抽出がサポートされています。
- チェックボックス機能 (プレビュー モード内) で、チェックボックス フィールドの抽出に一貫性がなく、結果に矛盾が生じるおそれがあります。 このように、システムがチェックボックスのフィールド値を正確に抽出できない場合は、[未検出] というラベルが表示されます。