Dokumentenextraktion – Übersicht
- Zuletzt aktualisiert2024/12/16
Dokumentenextraktion – Übersicht
Der Dokumentenextraktionsprozess ermöglicht es Ihnen, bestimmte Formular- und Tabellenfelder zu definieren, die Sie aus Ihren Dokumenten extrahieren möchten.
Anschließend extrahiert das System automatisch die spezifischen Daten aus diesen Dokumenten zur weiteren Analyse und Integration in nachgelagerte Workflows. Dieser Prozess verbessert die Effizienz, Genauigkeit und Gesamtproduktivität bei der Datenverarbeitung.
Wenn ein Nutzer eine neue Lerninstanz erstellt, erstellt der Control Room automatisch einen Ordner mit dem gleichen Namen wie die Lerninstanz im Ordner . Innerhalb dieses Ordners erstellt der Control Room die folgenden zwei Bots:
- Extraktions-Bot: Extrahiert Daten aus definierten Feldern in hochgeladenen Dokumenten.
- Download-Bot: Lädt die extrahierten Daten in einen bestimmten Ordner auf dem Gerät oder im freigegebenen Netzwerk herunter, abhängig von der im Download-Bot konfigurierten Option für die Ausgabeergebnisse.
Das Dokumentenextraktions-Paket wird verwendet, um Daten zu extrahieren und die extrahierten Daten aus Dokumenten an einen bestimmten Ort herunterzuladen.
Das Dokumentenextraktions-Paket bietet die folgenden Funktionen:
- Unterschiedliche Dokumenttypen: Verarbeiten Sie ein breites Spektrum an Dokumenttypen für verschiedene Anwendungsfälle der Dokumentverarbeitung. Sie können Ihre nutzerdefinierten Datenextraktionsparser integrieren, um Ihre vortrainierten, domänenspezifischen Modelle für Ihre Dokumentverarbeitungs-Workflows zu nutzen.
- Validierungsregeln: Definieren Sie verschiedene Bedingungen, z. B. Mustervergleiche oder Gleichheitsprüfungen. Wenn diese Bedingungen erfüllt sind, können Sie schnell Maßnahmen ergreifen, um Fehler oder Warnungen zu kennzeichnen, Werte zu bereinigen oder zu ersetzen oder neue Werte festzulegen. Diese Regeln stellen die Genauigkeit der extrahierten Daten über mehrere Felder in Ihren Dokumenten sicher.
- Generative KI-Anbieter: Extrahieren Sie Daten aus verschiedenen Dokumenttypen mithilfe vortrainierter Modelle von Anbietern generativer KI wie Azure OpenAI oder Anthropic. Nutzer können beim Konfigurieren von Feldern einmalig Suchanfragen definieren. Dann werden die Daten bei jedem verarbeiteten Dokument ohne zusätzliche Konfiguration extrahiert.
- Validierungsfeedback: Geben Sie Feedback zur Genauigkeit der extrahierten Daten, indem Sie die extrahierten Daten überprüfen und korrigieren. Durch diesen Prozess entsteht eine Feedbackschleife, die dem System hilft, die Datengenauigkeit im Laufe der Zeit kontinuierlich zu verbessern.
- Automation Co-Pilot-Validator: Bietet eine benutzerfreundliche Oberfläche zum Hervorheben von Fehlern oder Warnungen in Dokumenten. Der Validator zeigt eine rote Umrandung für Felder an, die eine Validierung erfordern. Nutzer können die Daten für solche Felder validieren und die Dokumente zur erneuten Verarbeitung übermitteln.
- Integration in Automation 360: Integriert die extrahierten Daten zur Weiterverarbeitung in Automation 360 nahtlos in verschiedene Workflows.