Automation 360

ビジョン駆動の生成 AI データ抽出

PDF としてダウンロード

コンテンツ

ビジョン駆動の生成 AI データ抽出

PDF としてダウンロード

最終更新日2025/04/02

ビジョン対応の生成 AIモデルは、レイアウト分析やフォームフィールド認識といった機能を活用して、複雑で非構造化なドキュメントからのデータ抽出精度を向上させることにより、ドキュメントオートメーションを強化します。これらのモデルは、人的介入を減らすことによってワークフローを効率化し、Microsoft OpenAIやAnthropic Claudeなどのプロバイダーによってさまざまな地域でサポートされています。

注: ビジョン駆動のドキュメント抽出モデルを使用するには、パッケージ生成 AIバージョン 3.35.14 以降を使用していることを確認してください。

視覚駆動型生成 AIモデルのドキュメントオートメーションにおける統合は、チェックボックスの認識や署名の検出など、視覚的に複雑な構造を持つ文書を処理するのに役立ちます。

ビジョン駆動型生成 AI モデルをサポートするパッケージを使用する場合、@GenAIVision プロンプトタグを使用して、ドキュメント抽出エンジンにデータ抽出にビジョン駆動型生成 AI モデルを使用するように指示できます。詳細については、[生成 AI プロンプトでプロンプトタグを使用する]を参照してください。

機能

次の画像は、生成 AIで使用されるビジョン駆動のドキュメントオートメーションモデルのいくつかの機能を示しています:

ドキュメントオートメーションビジョン駆動の生成 AI モデル機能

ドキュメントオートメーションビジョン駆動の生成 AIモデルは、他の生成 AIモデルに対して以下の強化された機能を提供します:

レイアウト分析
フォームフィールド認識
テーブル認識
画像とグラフィックの認識
署名とチェックボックスの認識

メリット

ビジョン駆動の生成 AI モデルには、以下のようなメリットがあります。

シームレスなデータ抽出: 複雑なテーブルから、ネストされた行、マージされた列、およびセクションを含むデータを抽出します。選択要素（チェックボックスなど）を認識してキャプチャします。
実際の事例のために開発されました: 請求書、購入注文書、医療文書、サプライチェーン文書など、さまざまな文書タイプからデータを抽出する際の課題を克服します。
手間のかからないセットアップ: 検索クエリを使用して情報を特定および抽出する、すぐに使用できる事前学習済みモデルを使用します。

地域サポートマトリックス

次の表は、異なる地域の生成 AI プロバイダーによってサポートされているビジョン駆動の生成 AI モデルを示しています:

注: プロバイダーに対して自分のライセンスを持ち込む (BYOL) を使用している場合、これらの設定は考慮されません。プロバイダーのBYOLの設定については、[[データの抽出] アクション]を参照してください。


地域	プロバイダー	ビジョン駆動の生成 AI モデルはサポートされていますか？	サポートされている生成 AI モデル
アメリカ	Microsoft OpenAI	はい	GPT-4o
アメリカ	Anthropic Claude (Amazon Bedrock)	はい	Claude 3 Haiku
欧州	Microsoft OpenAI	はい	GPT-4o
欧州	Anthropic Claude (Amazon Bedrock)	はい	Claude 3 Haiku
Rest of the world	Microsoft OpenAI	いいえ*	GPT-3.5 Turbo
Rest of the world	Anthropic Claude (Amazon Bedrock)	はい	Claude 3 Haiku