Verwenden der Aktion „Klassifizieren“

Die IQ Bot-Aktion „Klassifizieren“ gruppiert die Seiten eines Eingabedokuments auf der Grundlage der Modelldatei, die mit der IQ Bot-Aktion „Klassifizierer trainieren“ erstellt wurde.

Vorbereitungen

Erstellen Sie einen Bot mit der Klassifizieren-Aktion innerhalb einer Schleife-Aktion, um jede Datei im ausgewählten Ordner iterativ zu klassifizieren.

Prozedur

  1. Doppelklicken Sie in der Aktionen -Palette auf die Schleife-Aktion, oder ziehen Sie sie aus dem Schleife-Paket.
  2. Wählen Sie im Feld Schleifentyp die Option Iterator.
  3. Wählen Sie im Feld Iterator die Option Für jede Datei im Ordner aus der Dropdown-Liste.
  4. Wählen Sie im Feld Ordnerpfad den Pfad zu dem Ordner, der die Eingabedateien enthält.
  5. Erstellen Sie im Feld Dateiname und Erweiterung dieser Variable zuweisen eine Wörterbuchvariable, um die Namen und Erweiterungen der Dateien im ausgewählten Ordnerpfad zu speichern, oder wählen Sie eine solche aus.
    In diesem Beispiel wird eine Wörterbuchvariable namens dictFile verwendet.
  6. Doppelklicken Sie in der Aktionen -Palette auf die Klassifizieren-Aktion, oder ziehen Sie sie aus dem Dokumentenklassifizierer-Paket.
  7. Geben Sie im Feld Eingabedatei einen dynamischen Dateipfad über eine Variable ein.
    1. Fügen Sie einen Dateipfad hinzu, der auf den Ordner verweist, zum Beispiel C:\input\.
    2. Fügen Sie den dynamischen Dateinamen-String hinzu: $dictFile(name)$.$dictFile(extension)$.
      Anmerkung: Achten Sie darauf, einen Punkt zwischen die Variable mit dem Dateinamen und die Variable mit der Erweiterung zu setzen.
    Die Schlüssel Name und Erweiterung sind vordefiniert. Wenn die Aktion eingefügt und in einer Schleife ausgeführt wird, durchläuft sie den gesamten Ordner und ruft die Dateien im Ordner nacheinander auf. Der Wert der Eingabedatei sieht wie folgt aus: C:\Eingabe\$dictFile(name)$.$dictFile(extension)$
  8. Geben Sie im Feld Klassifizierer den Dateipfad zur Modelldatei an.
    Sie können entweder den .zip-Ordner auswählen oder die Datei .icmf aus diesem Ordner extrahieren und sie auswählen.
    Anmerkung: Um bessere Klassifizierungsergebnisse und -leistungen zu erzielen, empfehlen wir Ihnen, die Datei .icmf zu verwenden, die im .zip-Ordner der Klassifizierer trainieren-Aktion verfügbar ist.
  9. Verwenden Sie die Option Ausgabeordnerpfad, um das Dokument der Klassifizierungsausgabe zu speichern.
  10. Optional: Konfigurieren Sie die folgenden ERWEITERTE EINSTELLUNGEN:
    • Zuverlässigkeits-Grenzwert (%): Wenn der Zuverlässigkeitswert der Kategorievorhersage einer Seite unter dem Zuverlässigkeits-Grenzwert liegt, wird sie in den Ordner Nicht klassifiziert verschoben.
    • Klassifizierungs-Ausgabevariable speichern: Speichern Sie die Klassifizierungsergebnisse als eine Liste von Wörterbüchern mit den folgenden Schlüsseln:
      • fileName
      • pageIndex
      • category
      • confidence
    Anmerkung:
    • Sie können den Klassifizierungstyp im Dokumentenklassifizierer auswählen:
      • Bildbasierte Klassifizierung
      • Textbasierte Klassifizierung
      • Bild- und textbasierte Klassifizierung
    • Um einen höheren Konfidenzgrenzwert zu projizieren, sollten Sie den Konfidenzgrenzwert bei ähnlichen Dokumentseiten berechnen. Um den erforderlichen Konfidenzgrenzwert zu bestimmen, können Sie die Konfidenzgrenzwerte aus der Klassifizierungsausgabe zurate ziehen.
    • Der Dokumentenklassifizierer erkennt die Sprache für die Klassifizierung automatisch und unterstützt alle von ABBYY (optische Zeichenerkennung) unterstützten Sprachen.
  11. Klicken Sie auf Speichern und Ausführen.
    Die Seiten des Ausgabedokuments werden in den jeweiligen Unterordnern gespeichert, die auf den in der Modelldatei erstellten Kategorien basieren. Alle zuvor klassifizierten Dokumente im Ausgabeordner werden überschrieben.

Nächste Maßnahme

Sie können jeden Unterordner mit ähnlichen Dokumenten zum Erstellen und Trainieren einer Lerninstanz verwenden, um Daten aus den Dokumenten zu extrahieren. Einzelheiten finden Sie unter Lerninstanz erstellen.