ビジョン駆動の 生成 AI データ抽出
- 最終更新日2025/04/02
ビジョン対応の生成 AIモデルは、レイアウト分析やフォームフィールド認識といった機能を活用して、複雑で非構造化なドキュメントからのデータ抽出精度を向上させることにより、ドキュメント オートメーションを強化します。 これらのモデルは、人的介入を減らすことによってワークフローを効率化し、Microsoft OpenAIやAnthropic Claudeなどのプロバイダーによってさまざまな地域でサポートされています。
視覚駆動型生成 AIモデルのドキュメント オートメーションにおける統合は、チェックボックスの認識や署名の検出など、視覚的に複雑な構造を持つ文書を処理するのに役立ちます。
ビジョン駆動型 生成 AI モデルをサポートするパッケージを使用する場合、@GenAIVision プロンプト タグを使用して、ドキュメント抽出 エンジンにデータ抽出にビジョン駆動型 生成 AI モデルを使用するように指示できます。 詳細については、[生成 AI プロンプトでプロンプトタグを使用する]を参照してください。
機能
次の画像は、生成 AIで使用されるビジョン駆動のドキュメント オートメーションモデルのいくつかの機能を示しています:
ドキュメント オートメーションビジョン駆動の生成 AIモデルは、他の生成 AIモデルに対して以下の強化された機能を提供します:
- レイアウト分析
- フォームフィールド認識
- テーブル認識
- 画像とグラフィックの認識
- 署名とチェックボックスの認識
メリット
ビジョン駆動の 生成 AI モデルには、以下のようなメリットがあります。
- シームレスなデータ抽出
- 複雑なテーブルから、ネストされた行、マージされた列、およびセクションを含むデータを抽出します。 選択要素(チェックボックスなど)を認識してキャプチャします。
- 実際の事例のために開発されました
- 請求書、購入注文書、医療文書、サプライチェーン文書など、さまざまな文書タイプからデータを抽出する際の課題を克服します。
- 手間のかからないセットアップ
- 検索クエリを使用して情報を特定および抽出する、すぐに使用できる事前学習済みモデルを使用します。
地域サポートマトリックス
次の表は、異なる地域の 生成 AI プロバイダーによってサポートされているビジョン駆動の 生成 AI モデルを示しています:
地域 | プロバイダー | ビジョン駆動の 生成 AI モデルはサポートされていますか? | サポートされている 生成 AI モデル |
---|---|---|---|
アメリカ | Microsoft OpenAI | はい | GPT-4o |
Anthropic Claude (Amazon Bedrock) | はい | Claude 3 Haiku | |
欧州 | Microsoft OpenAI | はい | GPT-4o |
Anthropic Claude (Amazon Bedrock) | はい | Claude 3 Haiku | |
Rest of the world | Microsoft OpenAI | いいえ* | GPT-3.5 Turbo |
Anthropic Claude (Amazon Bedrock) | はい | Claude 3 Haiku |
* BYOL を構成して、独自のビジョン駆動の 生成 AI モデルをデータ抽出に使用することができます。 [[データの抽出] アクション]を参照してください。
他のリソース
詳細については、の[ビジョン パワード 生成 AIデータ抽出]コースを検索してくださいAutomation Anywhere University: RPA Training and Certification (A-People login required)。