Verbessern der Extraktionsgenauigkeit durch Validierung

Sie erfahren, wie das System die Extraktionsgenauigkeit durch vom Nutzer vorgenommene Änderungen in Validator verbessert.

Bei der Erstellung einer Lerninstanz hat der Nutzer die Möglichkeit, diese Funktion zu aktivieren, um der Lerninstanz auf der Grundlage der vom Nutzer vorgenommenen Änderungen im Validator Feedback zu senden. In Document Automation können Lerninstanzen, die sich im Produktionsmodus befinden, kontinuierlich „lernen“, wenn ein Nutzer die Größe des Extraktionsbereichs in Validator ändert oder ihn verschiebt.

Die folgende Grafik gibt einen visuellen Überblick über den Prozess, bei dem die Lerninstanzen kontinuierlich Feedback von der Validierung erhalten:

Prozess des „Anlernens“ von Lerninstanzen durch Validierungsfeedback

  1. Ein hochgeladenes Dokument durchläuft die Extraktionsmaschine.
  2. Wenn die Lerninstanz die Daten erfolgreich extrahiert, werden die extrahierten Werte in eine Datei im Ordner Success heruntergeladen.

    Wenn die Lerninstanz die Daten nicht extrahieren kann, bewertet das System, ob das Dokument ein ungewohntes Layout enthält.

  3. Wenn die Lerninstanz das Dokumentenlayout (neues Layout) nicht erkennt, wird das Dokument zur manuellen Validierung geschickt, bei der der Nutzer der Lerninstanz zeigt, wie die Daten zu extrahieren sind, indem er den Extraktionsbereich festlegt.
  4. Die extrahierten Werte werden in eine Datei im Ordner Success heruntergeladen, und die Änderungen werden in einer Feedback-Datei gesammelt, die an die Feedback-Datenbank gesendet wird.
    Anmerkung:
    • Feedback wird nur eingeholt, wenn der Nutzer den Extraktionsbereich ändert. Wenn der Nutzer den Text manuell eingibt, sammelt das System kein Feedback.
    • Die Feedback-Datei enthält nur Daten über den Feldstandort, um die Extraktionsgenauigkeit für nachfolgende Dokumente zu verbessern.

    Wenn die Lerninstanz das Cluster erkennt, ruft sie früheres Feedback aus der Feedback-Datenbank ab und setzt es zur Datenextraktion ein.

Verwenden von Validierungsfeedback zur Extraktion bestimmter Werte in einer Tabelle

Ab Automation 360 v.27 können Sie eine Lerninstanz trainieren, um Daten aus einer Zelle mit mehr als einem Feld zu extrahieren.

Wenn zum Beispiel eine Spalte mit einer Produktbeschreibung auch eine Artikelnummer enthält, können Sie die Artikelnummer in der Validierungsoberfläche angeben. Wenn die Lerninstanz nachfolgende Dokumente verarbeitet, extrahiert sie die Artikelnummer und ignoriert die Produktbeschreibung.

Gehen Sie folgendermaßen vor, um eine Lerninstanz zu konfigurieren, die bestimmte Werte aus einer Zelle extrahiert:
  1. Erstellen Sie eine Lerninstanz mit einem von Automation Anywhere vortrainierten Modell und wählen Sie die Option zum Senden von Validierungsfeedback: Erstellen einer Lerninstanz in Document Automation
  2. Laden Sie ein Beispieldokument hoch: Dokumente bearbeiten in Document Automation
  3. Suchen Sie im Validator das Feld und zeichnen Sie den Rahmen neu, so dass er nur die Werte umgibt, die Sie extrahieren möchten.
  4. Nachdem Sie auf Senden geklickt haben, werden die Informationen über den neuen Extraktionsbereich an die Feedback-Datenbank gesendet.
  5. Laden Sie weitere Dokumente hoch, um die Genauigkeit der Extraktion zu testen. Wenn Sie mit den Ergebnissen zufrieden sind, fahren Sie mit der Vorbereitung der Lerninstanz für die Ausführung in der Produktion fort: Lerninstanz für die Produktion veröffentlichen
Anmerkung: Sie können mit diesem Verfahren auch validierungsbasierte Verbesserungen für Lerninstanzen nutzen, die in Document Automation über IQ Bot mit dem PaketIQ Bot – Document Automation Bridge“ importiert werden. Weitere Informationen finden Sie unter IQ Bot – DA-Bridge-Paket.

So identifiziert Document Automation neue Layouts

Die Document Automation-Extraktion basiert auf der Erkennung von Objekten. Während der Dokumentenverarbeitung identifiziert die Extraktionsmaschine Objekte oder Schlüssel-Wert-Paare des Feldes und des zugehörigen Wertes. Diese Engine erstellt einen „Fingerabdruck“ des Dokuments, in dem die Reihenfolge der Objekte und die Position der einzelnen Objekte im Dokument gespeichert sind.

Wenn die Engine bei der Verarbeitung eines Dokuments die Schlüssel und ihre Positionen erkennt, wird das Dokument auf der Grundlage dieses vorhandenen Fingerabdrucks klassifiziert und extrahiert. Andernfalls speichert die Engine einen neuen Fingerabdruck der Schlüssel und ihres Erscheinungsortes.

Prozess, bei dem die Engine entweder den vorhandenen Fingerabdruck in einem Dokument erkennt oder einen neuen Fingerabdruck erstellt