ビジョン対応の生成 AIモデルは、レイアウト分析やフォームフィールド認識といった機能を活用して、複雑で非構造化なドキュメントからのデータ抽出精度を向上させることにより、ドキュメント オートメーションを強化します。 これらのモデルは、人的介入を減らすことによってワークフローを効率化し、Microsoft OpenAIAnthropic Claudeなどのプロバイダーによってさまざまな地域でサポートされています。

注: ビジョン駆動の ドキュメント抽出モデルを使用するには、パッケージ 生成 AIバージョン 3.35.14 以降を使用していることを確認してください。

視覚駆動型生成 AIモデルのドキュメント オートメーションにおける統合は、チェックボックスの認識や署名の検出など、視覚的に複雑な構造を持つ文書を処理するのに役立ちます。

ビジョン駆動型 生成 AI モデルをサポートするパッケージを使用する場合、@GenAIVision プロンプト タグを使用して、ドキュメント抽出 エンジンにデータ抽出にビジョン駆動型 生成 AI モデルを使用するように指示できます。 詳細については、[生成 AI プロンプトでプロンプトタグを使用する]を参照してください。

機能

次の画像は、生成 AIで使用されるビジョン駆動のドキュメント オートメーションモデルのいくつかの機能を示しています:

ドキュメント オートメーション ビジョン駆動の 生成 AI モデル機能

ドキュメント オートメーションビジョン駆動の生成 AIモデルは、他の生成 AIモデルに対して以下の強化された機能を提供します:

  • レイアウト分析
  • フォームフィールド認識
  • テーブル認識
  • 画像とグラフィックの認識
  • 署名とチェックボックスの認識

メリット

ビジョン駆動の 生成 AI モデルには、以下のようなメリットがあります。

シームレスなデータ抽出
複雑なテーブルから、ネストされた行、マージされた列、およびセクションを含むデータを抽出します。 選択要素(チェックボックスなど)を認識してキャプチャします。
実際の事例のために開発されました
請求書、購入注文書、医療文書、サプライチェーン文書など、さまざまな文書タイプからデータを抽出する際の課題を克服します。
手間のかからないセットアップ
検索クエリを使用して情報を特定および抽出する、すぐに使用できる事前学習済みモデルを使用します。

地域サポートマトリックス

次の表は、異なる地域の 生成 AI プロバイダーによってサポートされているビジョン駆動の 生成 AI モデルを示しています:

注: プロバイダーに対して自分のライセンスを持ち込む (BYOL) を使用している場合、これらの設定は考慮されません。 プロバイダーのBYOLの設定については、[[データの抽出] アクション]を参照してください。
地域 プロバイダー ビジョン駆動の 生成 AI モデルはサポートされていますか? サポートされている 生成 AI モデル
アメリカ Microsoft OpenAI はい GPT-4o
Anthropic Claude (Amazon Bedrock) はい Claude 3 Haiku
欧州 Microsoft OpenAI はい GPT-4o
Anthropic Claude (Amazon Bedrock) はい Claude 3 Haiku
Rest of the world Microsoft OpenAI いいえ* GPT-3.5 Turbo
Anthropic Claude (Amazon Bedrock) はい Claude 3 Haiku

* BYOL を構成して、独自のビジョン駆動の 生成 AI モデルをデータ抽出に使用することができます。 [[データの抽出] アクション]を参照してください。

他のリソース

詳細については、の[ビジョン パワード 生成 AIデータ抽出]コースを検索してくださいAutomation Anywhere University: RPA Training and Certification (A-People login required)