ビジョン対応のgenerative AIモデルは、レイアウト分析やフォームフィールド認識といった機能を活用して、複雑で非構造化なドキュメントからのデータ抽出精度を向上させることにより、ドキュメント オートメーションを強化します。 これらのモデルは、人的介入を減らすことによってワークフローを効率化し、Microsoft OpenAIAnthropic Claudeなどのプロバイダーによってさまざまな地域でサポートされています。

注: ビジョン駆動の Document Extractionモデルを使用するには、package generative AIバージョン 3.35.14 以降を使用していることを確認してください。

視覚駆動型generative AIモデルのDocument Automationへの統合は、チェックボックスの認識や署名の検出など、視覚的に複雑な構造を持つ文書を処理するのに役立ちます。

ビジョン駆動型 generative AI モデルをサポートするパッケージを使用する場合、@GenAIVision プロンプト タグを使用して、Document Extraction エンジンにデータ抽出にビジョン駆動型 generative AI モデルを使用するように指示できます。 詳細については、generative AI プロンプトでプロンプトタグを使用するを参照してください。

機能

次の画像は、generative AIで使用されるビジョン駆動のDocument Automationモデルのいくつかの機能を示しています:

Document Automation ビジョン駆動の generative AI モデル機能

Document Automationビジョン駆動のgenerative AIモデルは、他のgenerative AIモデルに対して以下の強化された機能を提供します:

  • レイアウト分析
  • フォームフィールド認識
  • テーブル認識
  • 画像とグラフィックの認識
  • 署名とチェックボックスの認識

メリット

ビジョン対応のgenerative AIモデルは、次のようなメリットがあります。

シームレスなデータ抽出
複雑なテーブルから、ネストされた行、マージされた列、およびセクションを含むデータを抽出します。 選択要素(チェックボックスなど)を認識してキャプチャします。
実際の事例のために開発されました
請求書、購入注文書、医療文書、サプライチェーン文書など、さまざまな文書タイプからデータを抽出する際の課題を克服します。
手間のかからないセットアップ
検索クエリを使用して情報を特定および抽出する、すぐに使用できる事前学習済みモデルを使用します。

地域サポートマトリックス

次の表は、異なる地域の generative AI プロバイダーによってサポートされているビジョン駆動の generative AI モデルを示しています:

注:
  • BYOK(Bring Your Own Key)を使用している場合(自分のアカウントにホストされているモデル)、このマトリックスに記載されている情報は適用されません。 BYOK の構成方法についての指示は、データの抽出 action を参照してください。
  • BYOK を使用する場合は、Model connections を使用してください。 Document Automation 内で Model connections を使用を参照してください。
地域 プロバイダー ビジョン駆動の generative AI モデルはサポートされていますか? サポートされている generative AI モデル
アメリカ Microsoft OpenAI はい GPT-5.1
Anthropic Claude (Amazon Bedrock) はい Claude Haiku 4.5
Google Gemini はい Gemini 2.5 Flash
ヨーロッパ Microsoft OpenAI はい GPT-5.1
Anthropic Claude (Amazon Bedrock) はい Claude Haiku 4.5
Google Gemini はい Gemini 2.5 Flash
オーストラリア Microsoft OpenAI はい GPT-4.0
Anthropic Claude (Amazon Bedrock) はい Claude Haiku 4.5
インド Microsoft OpenAI はい GPT-4.0
Anthropic Claude (Amazon Bedrock) はい Claude 3 Haiku
カナダ Microsoft OpenAI はい GPT-4.0
日本 Microsoft OpenAI はい GPT-4.0

他のリソース

詳細については、のビジョン パワード Generative AIデータ抽出コースを検索してくださいAutomation Anywhere University: RPA Training and Certification (A-People login required)