Verbessern der Extraktionsgenauigkeit durch Validierung
- Zuletzt aktualisiert2024/08/21
Verbessern der Extraktionsgenauigkeit durch Validierung
Sie erfahren, wie das System die Extraktionsgenauigkeit durch vom Nutzer vorgenommene Änderungen in Validator verbessert.
Bei der Erstellung einer Lerninstanz hat der Nutzer die Möglichkeit, diese Funktion zu aktivieren, um der Lerninstanz auf der Grundlage der vom Nutzer vorgenommenen Änderungen im Validator Feedback zu senden. In Document Automation können Lerninstanzen, die sich im Produktionsmodus befinden, kontinuierlich „lernen“, wenn ein Nutzer die Größe des Extraktionsbereichs in Validator ändert oder ihn verschiebt.
Die folgende Grafik gibt einen visuellen Überblick über den Prozess, bei dem die Lerninstanzen kontinuierlich Feedback von der Validierung erhalten:
- Ein hochgeladenes Dokument durchläuft die Extraktionsmaschine.
- Wenn die Lerninstanz die Daten erfolgreich extrahiert, werden die extrahierten Werte in eine Datei im Ordner
Success
heruntergeladen.Wenn die Lerninstanz die Daten nicht extrahieren kann, bewertet das System, ob das Dokument ein ungewohntes Layout enthält.
- Wenn die Lerninstanz das Dokumentenlayout (neues Layout) nicht erkennt, wird das Dokument zur manuellen Validierung geschickt, bei der der Nutzer der Lerninstanz zeigt, wie die Daten zu extrahieren sind, indem er den Extraktionsbereich festlegt.
- Die extrahierten Werte werden in eine Datei im Ordner
Success
heruntergeladen, und die Änderungen werden in einer Feedback-Datei gesammelt, die an die Feedback-Datenbank gesendet wird.Anmerkung:- Feedback wird nur eingeholt, wenn der Nutzer den Extraktionsbereich ändert. Wenn der Nutzer den Text manuell eingibt, sammelt das System kein Feedback.
- Die Feedback-Datei enthält nur Daten über den Feldstandort, um die Extraktionsgenauigkeit für nachfolgende Dokumente zu verbessern.
Wenn die Lerninstanz das Cluster erkennt, ruft sie früheres Feedback aus der Feedback-Datenbank ab und setzt es zur Datenextraktion ein.
Verwenden von Validierungsfeedback zur Extraktion bestimmter Werte in einer Tabelle
Ab Automation 360 v.27 können Sie eine Lerninstanz trainieren, um Daten aus einer Zelle mit mehr als einem Feld zu extrahieren.
Wenn zum Beispiel eine Spalte mit einer Produktbeschreibung auch eine Artikelnummer enthält, können Sie die Artikelnummer in der Validierungsoberfläche angeben. Wenn die Lerninstanz nachfolgende Dokumente verarbeitet, extrahiert sie die Artikelnummer und ignoriert die Produktbeschreibung.
- Erstellen Sie eine Lerninstanz mit einem von Automation Anywhere vortrainierten Modell und wählen Sie die Option zum Senden von Validierungsfeedback: Erstellen einer Lerninstanz in Document Automation
- Laden Sie ein Beispieldokument hoch: Dokumente bearbeiten in Document Automation
- Suchen Sie im Validator das Feld und zeichnen Sie den Rahmen neu, so dass er nur die Werte umgibt, die Sie extrahieren möchten.
- Nachdem Sie auf Senden geklickt haben, werden die Informationen über den neuen Extraktionsbereich an die Feedback-Datenbank gesendet.
- Laden Sie weitere Dokumente hoch, um die Genauigkeit der Extraktion zu testen. Wenn Sie mit den Ergebnissen zufrieden sind, fahren Sie mit der Vorbereitung der Lerninstanz für die Ausführung in der Produktion fort: Lerninstanz für die Produktion veröffentlichen
So identifiziert Document Automation neue Layouts
Die Document Automation-Extraktion basiert auf der Erkennung von Objekten. Während der Dokumentenverarbeitung identifiziert die Extraktionsmaschine Objekte oder Schlüssel-Wert-Paare des Feldes und des zugehörigen Wertes. Diese Engine erstellt einen „Fingerabdruck“ des Dokuments, in dem die Reihenfolge der Objekte und die Position der einzelnen Objekte im Dokument gespeichert sind.
Wenn die Engine bei der Verarbeitung eines Dokuments die Schlüssel und ihre Positionen erkennt, wird das Dokument auf der Grundlage dieses vorhandenen Fingerabdrucks klassifiziert und extrahiert. Andernfalls speichert die Engine einen neuen Fingerabdruck der Schlüssel und ihres Erscheinungsortes.