Automation 360

Vision-gestützte Datenerfassung über generative AI

Als PDF herunterladen

Inhalte

Vision-gestützte Datenerfassung über generative AI

Als PDF herunterladen

Zuletzt aktualisiert2026/03/18

Vision-gestützte Datenerfassung über generative AI

Vision-gestützte generative AI-Modelle verbessern die Dokumentenautomatisierung, indem sie die Genauigkeit der Datenerfassung aus komplexen und unstrukturierten Dokumenten erhöhen und Fähigkeiten wie Layout-Analyse und Formularfelderkennung nutzen. Diese Modelle optimieren Arbeitsabläufe, da sie weniger menschliche Eingriffe erfordern, und werden in verschiedenen Regionen von Anbietern wie Microsoft OpenAI und Anthropic Claude unterstützt.

Anmerkung: Vergewissern Sie sich, dass Sie die Document Extraction package-Version 3.35.14 oder höher verwenden, um die Vision-gestützten generative AI-Modelle nutzen zu können.

Die Integration von Vision-gestützten generative AI-Modellen in Document Automation wird dabei helfen, Dokumente mit visuell komplexen Strukturen zu verarbeiten, wie etwa zum Erkennen von Kontrollkästchen und zum Erkennen von Unterschriften.

Wenn Sie das Paket verwenden, das Vision-basierte generative AI-Modelle unterstützt, können Sie das Eingabeaufforderungs-Tag @GenAIVision verwenden, um der Document Extraction-Engine mitzuteilen, dass Vision-basierte generative AI-Modelle für die Datenextraktion verwendet werden sollen. Weitere Informationen finden Sie unter Verwenden von Eingabeaufforderungs-Tags in Eingabeaufforderungen für generative AI.

Möglichkeiten

Das folgende Bild zeigt einige der Fähigkeiten der Vision-gestützten generative AI-Modelle, die in Document Automation verwendet werden:

Document Automation mit Vision-gestützten generative AI-Modellfunktionen

Document Automation mit Vision-gestützten generative AI-Modellen bieten im Vergleich zu anderen generative AI-Modellen die folgenden erweiterten Funktionen:

Layoutanalyse
Formularfelderkennung
Tabellenerkennung
Bild- und Grafikerkennung
Unterschrift- und Kontrollkästchenerkennung

Vorteile

Vision-gestützte generative AI-Modelle bieten die folgenden Vorteile:

Nahtlose Datenextraktion: Extrahiert Daten aus komplexen Tabellen mit verschachtelten Zeilen, zusammengeführten Spalten und Abschnitten. Erkennt und erfasst Auswahlelemente wie Kontrollkästchen.
Entwickelt für reale Anwendungsfälle: Bewältigt Herausforderungen bei der Extraktion von Daten aus verschiedenen Dokumenttypen wie Rechnungen, Bestellungen, Gesundheitsdokumenten und Lieferkettenunterlagen.
Mühelose Einrichtung: Verwendet vortrainierte Modelle, die sofort einsatzbereit sind, wobei Suchanfragen genutzt werden, um Informationen zu identifizieren und zu extrahieren.

Regionen-Supportmatrix

In der folgenden Tabelle sind die Vision-gestützten generative AI-Modelle aufgeführt, die von den generative AI-Anbietern in verschiedenen Regionen unterstützt werden:

Anmerkung:

Wenn Sie Ihr eigenes Schlüsselmodell (BYOK) verwenden (Modelle, die in Ihrem eigenen Konto gehostet werden), gilt die in dieser Matrix bereitgestellte Information nicht. Anleitungen zur Konfiguration von BYOK finden Sie unter action „Daten extrahieren“.
Bei Verwendung von BYOK verwenden Sie Model connections. Einzelheiten finden Sie unter Verwenden von Model connections in Document Automation.


Regionen	Anbieter	Wird das Vision-gestützte generative AI-Modell unterstützt?	Unterstützte generative AI-Modelle
Vereinigte Staaten	Microsoft OpenAI	Ja	GPT-5.1
	Anthropic Claude (Amazon Bedrock)	Ja	Claude Haiku 4.5
	Google Gemini	Ja	Gemini 2.5 Flash
Europa	Microsoft OpenAI	Ja	GPT-5.1
	Anthropic Claude (Amazon Bedrock)	Ja	Claude Haiku 4.5
	Google Gemini	Ja	Gemini 2.5 Flash
Australien	Microsoft OpenAI	Ja	GPT-4.0
Australien	Anthropic Claude (Amazon Bedrock)	Ja	Claude Haiku 4.5
Indien	Microsoft OpenAI	Ja	GPT-4.0
Indien	Anthropic Claude (Amazon Bedrock)	Ja	Claude 3 Haiku
Kanada	Microsoft OpenAI	Ja	GPT-4.0
Japan	Microsoft OpenAI	Ja	GPT-4.0

Weitere Ressourcen

Um mehr zu erfahren, suchen Sie nach dem Kurs Vision Powered Generative AI Data Extraction (Vision-gestützte Datenerfassung) in Automation Anywhere University: RPA Training and Certification (A-People login required).

Zurück

Kein vorheriges Thema

Weiter

Kein nächstes Thema

Zurück

Kein vorheriges Thema

Weiter

Kein nächstes Thema