Dokumente bearbeiten in Community Edition

Laden Sie Beispielrechnungen hoch, um die Lerninstanz zu trainieren, die extrahierten Daten zu überprüfen und Validierungsfehler zu beheben.

Vorbereitungen

  • Falls Sie dies noch nicht getan haben, Erstellen einer Lerninstanz in Community Edition.
  • Achten Sie darauf, dass jede Datei höchstens 2 MB groß ist.
  • Stellen Sie sicher, dass die Beispielrechnungen in den folgenden unterstützten Dokumenttypen vorliegen:
    • PDF
    • JPG
    • JPEG
    • PNG
    • TIF
    • TIFF

Laden Sie Beispielrechnungen in eine Lerninstanz hoch, um die Datenextraktionsfunktionen der Lerninstanz zu testen. Wenn ein Dokument eine manuelle Validierung erfordert, sendet das System es an den Validator, wo Sie die korrekten Daten manuell eingeben müssen.

Prozedur

  1. Hochladen von Dokumenten in die Lerninstanz:
    Anmerkung: Community Edition kann maximal fünf Dokumente auf einmal verarbeiten. Sie müssen warten, bis ein Dokument erfolgreich verarbeitet (und ggf. validiert) wurde, bevor Sie ein weiteres Dokument hochladen können.
    1. Klicken Sie auf Dokumente verarbeiten.
    2. Klicken Sie im Fenster Dokumente verarbeiten auf Durchsuchen, um die hochzuladenden Dateien auszuwählen.
    3. Geben Sie im Feld Daten herunterladen in den Dateipfad ein, unter dem die extrahierten Daten in eine CSV-Datei ausgegeben werden.
    4. Klicken Sie auf Dokumente verarbeiten.
      Das Fenster Bot Runner erscheint. Das Fenster wird ausgeblendet, wenn die Bearbeitung der Dokumente abgeschlossen ist. Aktualisieren Sie die Tabelle Lerninstanzen, um die aktualisierten Metriken zu sehen.

Wenn ein Wert neben dem Link Dokumente validieren steht, müssen Sie die fehlerhaften Felder manuell überprüfen. Fahren Sie andernfalls mit Schritt 2b fort, um die extrahierten Daten zu überprüfen.

  1. Beheben der Validierungsfehler
    1. Klicken Sie auf Dokumente validieren.
      Der Automation Co-Pilot-Task-Manager wird in einer neuen Registerkarte geöffnet, auf der sich das erste fehlgeschlagene Dokument in der Warteschlange befindet. Eine Einführung in die Nutzeroberfläche von Validator finden Sie unter Verwenden des Automation Co-Pilot-Task-Manager-Validators für Document Automation.
    2. Überprüfen Sie jedes Feld, um den Datentyp und den extrahierten Wert zu verifizieren.
      Document Automation unterstützt die folgenden Datentypen: Text, Zahl, Datum, Adresse und Kontrollkästchen
      Alternativ können Sie in der Dropdown-Liste auf der rechten Seite die Option Felder anzeigen, die validiert werden müssen auswählen.
      Anmerkung: Wenn Sie die Lerninstanz bearbeiten, während Dokumente auf ihre Validierung warten, klicken Sie auf Neu verarbeiten, um die Extraktion erneut zu starten.

      Die erneute Verarbeitung von Dokumenten hat keinen Einfluss auf die Metrik der hochgeladenen Dokumente.

    3. Aktualisieren Sie die Felder mit Fehlern.
      Klicken Sie auf das Feld oder ziehen Sie einen Rahmen um die Werte, die Sie extrahieren möchten.
      Bei von Automation Anywhere vortrainierten Modellen können Sie die Lerninstanz so konfigurieren, dass bestimmte Werte in einem Feld extrahiert und andere ignoriert werden. Weitere Informationen finden Sie unter Verbessern der Extraktionsgenauigkeit durch Validierung.
      • Wenn Sie ein Dokument überspringen möchten, ohne die Fehler zu korrigieren, klicken Sie auf Überspringen, um mit dem nächsten Dokument in der Validierungswarteschlange fortzufahren.
      • Um ein Dokument zu entfernen, das nicht verarbeitet werden kann, klicken Sie auf Als ungültig kennzeichnen.
    4. Nachdem Sie die notwendigen Korrekturen vorgenommen haben, klicken Sie auf Absenden, damit das Dokument fertig verarbeitet werden kann.
      Das nächste Dokument in der Warteschlange wird angezeigt. Wenn alle Dokumente korrigiert sind, zeigt das System eine Meldung an, dass keine weiteren Aufgaben mehr verfügbar sind.
    5. Schließen Sie die Registerkarte, um zur Seite Lerninstanzen zurückzukehren.
  2. Überprüfen der Ausgabeergebnisse:
    1. Öffnen Sie die Datei mit den extrahierten Daten im Ordner Success und überprüfen Sie die Ergebnisse, um sicherzustellen, dass sie Ihrem Anwendungsfall entsprechen.
      Die Microsoft-Formulare geben extrahierte Werte (OCR-Daten) im JSON-Format zurück, z. B. GUID_0-MSFormTableResult.json. Neben den extrahierten Dokumentdaten in der CSV-Datei <<GUID>>_FileName zeigt der Ordner Success auch die extrahierten Tabellendaten separat in einer weiteren CSV-Datei. Je nach Anzahl der Tabellen im Dokument können Sie verschiedene CSV-Dateien für jede Tabelle finden. Zum Beispiel: <<GUID_PAGE_NUMBER-Table_FILENAME_PAGENUMBER_TABLENUMBER.

      Mit separaten Tabellendaten können Sie die extrahierten Daten mit den Microsoft-Engine-Daten in der Datei GUID_0-MSFormTableResult.json vergleichen.

    2. Optional: Überprüfen Sie das Lerninstanz-Dashboard.
      Das Dashboard zeigt die Gesamtzahl der hochgeladenen Dokumente und die Anzahl der Dokumente, die validiert werden müssen.

Nächste Maßnahme

Herzlichen Glückwunsch! Sie haben nun erfolgreich Ihre ersten Dokumente in der Community Edition-Version von Document Automation verarbeitet.