Lesen und beachten Sie die Automation Anywhere-Dokumentation

Automation 360

Inhalt schließen

Inhalte

Inhalt öffnen

Datenextraktion in Document Automation

  • Aktualisiert: 2022/07/14
    • Automation 360 v.x
    • IQ Bot
    • Digitize

Datenextraktion in Document Automation

Verstehen, wie die Dokumente in Document Automation.

Verbesserung der Extraktionsgenauigkeit durch Validierung

Wenn eine Lerninstanz erstellt wird, hat der Benutzer die Möglichkeit, diese Funktion zu aktivieren, um Feedback an die Lerninstanz zu senden, das auf den vom Benutzer vorgenommenen Änderungen in der Validator. Unter Document Automationkönnen Lerninstanzen, die im Produktionsmodus laufen, kontinuierlich "lernen", wenn ein Benutzer die Größe der Extraktionsregion in der Validator.
Anmerkung: Diese Funktion ist nur für bereits Automation Anywhere vortrainierte Modelle.

Die folgende Grafik gibt einen visuellen Überblick über den Prozess, bei dem die Lerninstanzen kontinuierlich Feedback von der Validierung erhalten:

Prozess des "Lehrens" von Lerninstanzen durch Validierungs-Feedback

  1. Ein hochgeladenes Dokument durchläuft die Extraktionsmaschine.
  2. Wenn die Lerninstanz die Daten erfolgreich extrahiert, wird das Dokument zur STP-Zählung (Straight-Through-Processing) hinzugefügt, und die extrahierten Werte werden in eine Datei im Ordner Erfolg Ordner heruntergeladen.

    Wenn die Lerninstanz die Daten nicht extrahieren kann, bewertet das System, ob das Dokument ein ungewohntes Layout enthält.

  3. Wenn die Lerninstanz das Dokumentenlayout (neues Layout) nicht erkennt, wird das Dokument zur manuellen Validierung geschickt, bei der der Benutzer der Lerninstanz "beibringt", wie die Daten zu extrahieren sind, indem er den Extraktionsbereich festlegt.
  4. Die extrahierten Werte werden in eine Datei in der Erfolg heruntergeladen, und die Änderungen werden in einer Feedback-Datei gesammelt, die an die Feedback-Datenbank gesendet wird.
    Anmerkung:
    • Rückmeldungen werden nur eingeholt, wenn der Benutzer den Extraktionsbereich ändert. Wenn der Benutzer den Text manuell eingibt, sammelt das System keine Rückmeldungen.
    • Die Rückmeldedatei enthält nur Daten über den Feldstandort, um die Extraktionsgenauigkeit für nachfolgende Dokumente zu verbessern.

    Wenn die Lerninstanz den Cluster erkennt, ruft sie früheres Feedback aus der Feedback-Datenbank ab und verwendet es zur Datenextraktion.

Wie Document Automation identifiziert neue Layouts

Document Automation Die Extraktion basiert auf der Erkennung von Objekten. Während der Dokumentenverarbeitung identifiziert die Extraktionsmaschine Objekte oder Schlüssel-Wert-Paare des Feldes und des zugehörigen Wertes. Die Engine erstellt einen "Fingerabdruck" des Dokuments, in dem die Reihenfolge der Objekte und die Position der einzelnen Objekte im Dokument gespeichert sind.

Wenn die Engine bei der Verarbeitung eines Dokuments die Schlüssel und ihre Positionen erkennt, wird das Dokument auf der Grundlage dieses vorhandenen Fingerabdrucks klassifiziert und extrahiert. Andernfalls speichert die Engine einen neuen Fingerabdruck der Schlüssel und ihrer Standorte.

Prozess, bei dem die Engine entweder den vorhandenen Fingerabdruck in einem Dokument erkennt oder einen neuen Fingerabdruck erstellt

Feedback senden