Verwenden der Aktion „Seiten klassifizieren“

Die Aktion Seiten klassifizieren gruppiert die Seiten eines Eingabedokuments auf der Grundlage der Modelldatei, die mit der Aktion Advanced Classifier trainieren erstellt wurde, und filtert die Seiten heraus, die nicht in das Modell passen.

Vorbereitungen

  • Erstellen Sie bei Bedarf mit der Aktion Advanced Classifier trainieren eine Modelldatei.
  • Achten Sie darauf, dass die Eingabedateien im erforderlichen Format vorliegen.

Erstellen Sie mit der Aktion Seiten klassifizieren innerhalb einer Aktion Schleife einen Bot, um die einzelnen Dateien im ausgewählten Ordner iterativ zu klassifizieren.

Prozedur

  1. Doppelklicken Sie auf oder ziehen Sie in der Palette Aktionen die Aktion Seiten klassifizieren im Advanced Classifier-Paket.
  2. Geben Sie im Feld Eingabedatei den Standard-Dateipfad für eingehende Dateien zur Klassifizierung an:
    • Control Room-Datei
    • Desktop-Datei
    • Variable
  3. Geben Sie im Feld Klassifizierer den Dateipfad der Modelldatei an. Sie können entweder den .zip-Ordner auswählen oder die Datei .clsproj3 aus diesem Ordner extrahieren und sie auswählen.
    • Control Room-Datei
    • Desktop-Datei
    • Variable
  4. Mit der Option Ausgabeordnerpfad speichern Sie die Dokumente der Klassifizierungsausgabe. Die Seiten des Ausgabedokuments werden in den jeweiligen Unterordnern gespeichert, die auf den in der Modelldatei erstellten Kategorien basieren.
    • Desktopordner
    • Variable
  5. Geben Sie im Feld Lizenz einen Lizenznachweis an.
  6. Wenn Sie die Option Anmeldedaten auswählen, klicken Sie auf Aussuchen, um eine Lizenz aus dem Lizenz-Locker bereitzustellen.
  7. Optional: Konfigurieren Sie Folgendes:
    Klassifizierungs-Ausgabevariable speichern: Speichern Sie die Klassifizierungsergebnisse als eine Liste von Wörterbüchern mit den folgenden Schlüsseln:
    • fileName: Name der Datei, die Sie verarbeiten möchten, mit angehängtem Indexwert. Beispiel: <<Dateiname_SeitenIndex>>
    • index: Seitenzahlwert, wenn mehrere Seiten vorhanden sind
    • category: Kategorie, zu der die Datei nach der Klassifizierung gehört. So werden zum Beispiel alle personalbezogenen Dokumente in einer Kategorie zusammengefasst.
    • confidence: Der prozentuale Schwellenwert, der die Klassifizierung angibt, z. B. welche Datei zu welcher Kategorie gehört, basierend auf Trainingsdaten.
    Anmerkung:
    • Sie können den Klassifizierungstyp im Advanced Classifier auswählen:
      • Bildbasierte Klassifizierung
      • Textbasierte Klassifizierung
      • Bild- und textbasierte Klassifizierung
  8. Klicken Sie auf Speichern und Ausführen.

Nächste Maßnahme

Sie können jeden Unterordner mit ähnlichen Dokumenten zum Erstellen und Trainieren einer Lerninstanz verwenden, um Daten aus den Dokumenten zu extrahieren.