Aktion „Advanced Classifier trainieren“ verwenden

Verwenden Sie die Aktion Advanced Classifier trainieren, um eine Modelldatei zu erstellen, die von den Aktionen Dokumente klassifizieren, Seiten klassifizieren und Dokument unterteilen verwendet wird, um die Dokumente in die für die Eingabe erforderlichen Kategorien zu sortieren.

Vorbereitungen

Sammeln Sie vor der Erstellung des Bots Beispieldokumente und kategorisieren Sie sie in Ordnern. Stellen Sie sicher, dass die Beispieldokumente die folgenden Anforderungen erfüllen:
  • Müssen mindestens zwei Kategorien haben.
  • Pro Kategorie sind mindestens 15 Dateien erforderlich, empfohlen werden jedoch 20 Dateien pro Kategorie.
  • Es gibt keine Beschränkungen für die maximale Anzahl an Kategorien. Es ist jedoch zu beachten, dass mit zunehmender Größe des Trainingsdatensatzes und der entsprechenden Modellgröße die Leistung des Klassifizierungsprozesses abnehmen kann. Daher ist es ratsam, die Anzahl der Kategorien in einem Bereich von 150 pro Modelldatei zu halten, um eine optimale Leistung zu erzielen.
  • Die folgenden Dateiformate werden unterstützt:
    • .tiff
    • .bitmap
    • .jepg
    • .png
    • .pdf
    • .txt
  • Wir empfehlen, dass Sie Bilder mit einer Auflösung von 300 dpi (dots per inch) bereitstellen. Die zulässige Mindestauflösung beträgt 200 dpi.
Anmerkung:

Wenn diese Mindestanforderungen nicht erfüllt sind, wird während der Bot-Laufzeit eine Fehlermeldung angezeigt.

Prozedur

  1. Doppelklicken oder ziehen Sie in der Palette Aktionen die Aktion Advanced Classifier trainieren aus dem Advanced Classifier-Paket.
  2. Geben Sie im Feld Modellname einen Namen für die Modelldatei ein.
  3. Wählen Sie den Pfad des Trainingsordners aus Desktop-Ordner oder Variable. Der Pfad des Eingabeordners muss Unterverzeichnisse mit den Namen enthalten, die der Kategorie der Dokumente entsprechen, auf die Sie den Klassifizierer trainieren möchten. Wenn es sich beispielsweise um kaufmännische Dokumente handelt, muss der Pfad des Eingabeordners Unterordner wie Rechnung und Bestellung enthalten.
  4. Optional: Wenn Sie Desktop-Datei wählen, klicken Sie auf Durchsuchen, um den Standard-Dateipfad zu ändern. Zum Beispiel: C:\Nutzer\David\Bankauszug\TrainingsDaten
  5. Verwenden Sie das Feld Modellausgabepfad, um das Verzeichnis für die Ausgabemodelldatei auszuwählen.
  6. Geben Sie im Feld Lizenz einen Lizenznachweis an.
  7. Wenn Sie die Option Anmeldedaten auswählen, klicken Sie auf Aussuchen, um eine Lizenz aus dem Lizenz-Locker bereitzustellen.
  8. Im Feld Dokumentunterteilungs-Training:
    Wenn Sie Deaktiviert auswählen:
    1. Wählen Sie unter „Erweiterte Einstellungen“ den Klassifizierungstyp aus dem Dropdown-Menü aus, basierend auf dem Typ des Klassifizierers, den Sie erstellen möchten:
      • Visueller Klassifizierer
      • Inhaltlicher Klassifizierer
      • Visueller und inhaltlicher Klassifizierer
    2. Optional: Fügen Sie die Textregeln hinzu.
    Wenn Sie Aktiviert auswählen:
    1. Sie sehen die folgenden Optionen:
      • Unbekanntes Dokument zusammenführen – standardmäßig deaktiviert.
      • Grenzwert für unbekannte Seiten – standardmäßig 30 Prozent
      • Zuverlässigkeits-Grenzwert für Unterteilungen (oder Trennungs-Grenzwert für Unterteilungen) – standardmäßig 70 Prozent.
    2. Wählen Sie unter „Erweiterte Einstellungen“ den Klassifizierungstyp aus dem Dropdown-Menü aus, basierend auf dem Typ des Klassifizierers, den Sie erstellen möchten:
      • Visueller Klassifizierer
      • Inhaltlicher Klassifizierer
      • Visueller und inhaltlicher Klassifizierer
    3. Optional: Fügen Sie die Textregeln hinzu.
    Anmerkung: Es darf nur eine Regeldatei pro Kategorie geben. Wenn die Regeldatei außerhalb der Kategorieordner platziert wird, erscheint die folgende Fehlermeldung:

    Invalid rule file location

  9. Klicken Sie auf Speichern und Ausführen.

Nächste Maßnahme

Nach der Erstellung des Modells erstellen Sie einen Bot zur Klassifizierung der Eingabedokumente. Weitere Informationen finden Sie unter Verwenden der Aktion „Dokument klassifizieren“.