ビジョン駆動の generative AI データ抽出
- 最終更新日2026/03/18
ビジョン対応のgenerative AIモデルは、レイアウト分析やフォームフィールド認識といった機能を活用して、複雑で非構造化なドキュメントからのデータ抽出精度を向上させることにより、ドキュメント オートメーションを強化します。 これらのモデルは、人的介入を減らすことによってワークフローを効率化し、Microsoft OpenAIやAnthropic Claudeなどのプロバイダーによってさまざまな地域でサポートされています。
視覚駆動型generative AIモデルのDocument Automationへの統合は、チェックボックスの認識や署名の検出など、視覚的に複雑な構造を持つ文書を処理するのに役立ちます。
ビジョン駆動型 generative AI モデルをサポートするパッケージを使用する場合、@GenAIVision プロンプト タグを使用して、Document Extraction エンジンにデータ抽出にビジョン駆動型 generative AI モデルを使用するように指示できます。 詳細については、generative AI プロンプトでプロンプトタグを使用するを参照してください。
機能
次の画像は、generative AIで使用されるビジョン駆動のDocument Automationモデルのいくつかの機能を示しています:
Document Automationビジョン駆動のgenerative AIモデルは、他のgenerative AIモデルに対して以下の強化された機能を提供します:
- レイアウト分析
- フォームフィールド認識
- テーブル認識
- 画像とグラフィックの認識
- 署名とチェックボックスの認識
メリット
ビジョン対応のgenerative AIモデルは、次のようなメリットがあります。
- シームレスなデータ抽出
- 複雑なテーブルから、ネストされた行、マージされた列、およびセクションを含むデータを抽出します。 選択要素(チェックボックスなど)を認識してキャプチャします。
- 実際の事例のために開発されました
- 請求書、購入注文書、医療文書、サプライチェーン文書など、さまざまな文書タイプからデータを抽出する際の課題を克服します。
- 手間のかからないセットアップ
- 検索クエリを使用して情報を特定および抽出する、すぐに使用できる事前学習済みモデルを使用します。
地域サポートマトリックス
次の表は、異なる地域の generative AI プロバイダーによってサポートされているビジョン駆動の generative AI モデルを示しています:
- BYOK(Bring Your Own Key)を使用している場合(自分のアカウントにホストされているモデル)、このマトリックスに記載されている情報は適用されません。 BYOK の構成方法についての指示は、データの抽出 action を参照してください。
- BYOK を使用する場合は、Model connections を使用してください。 Document Automation 内で Model connections を使用を参照してください。
| 地域 | プロバイダー | ビジョン駆動の generative AI モデルはサポートされていますか? | サポートされている generative AI モデル |
|---|---|---|---|
| アメリカ | Microsoft OpenAI | はい | GPT-5.1 |
| Anthropic Claude (Amazon Bedrock) | はい | Claude Haiku 4.5 | |
| Google Gemini | はい | Gemini 2.5 Flash | |
| ヨーロッパ | Microsoft OpenAI | はい | GPT-5.1 |
| Anthropic Claude (Amazon Bedrock) | はい | Claude Haiku 4.5 | |
| Google Gemini | はい | Gemini 2.5 Flash | |
| オーストラリア | Microsoft OpenAI | はい | GPT-4.0 |
| Anthropic Claude (Amazon Bedrock) | はい | Claude Haiku 4.5 | |
| インド | Microsoft OpenAI | はい | GPT-4.0 |
| Anthropic Claude (Amazon Bedrock) | はい | Claude 3 Haiku | |
| カナダ | Microsoft OpenAI | はい | GPT-4.0 |
| 日本 | Microsoft OpenAI | はい | GPT-4.0 |
他のリソース
詳細については、のビジョン パワード Generative AIデータ抽出コースを検索してくださいAutomation Anywhere University: RPA Training and Certification (A-People login required)。