Advanced Classifier-Paket
- Zuletzt aktualisiert2024/12/03
Advanced Classifier-Paket
Mit dem Advanced Classifier-Paket können Sie Dokumente in einer Ordnerstruktur klassifizieren. Sie können die Dokumente aus den Ordnern in die jeweilige Lerninstanz zur Inhaltsextraktion in Document Automation hochladen.
- Laden Sie das Advanced Classifier-Paket vom A-People Downloadportal A-People Downloads page (Login required) herunter. Klicken Sie zum Abrufen dieses Pakets auf eine bestimmte Automation 360 IQ Bot-Version > Installation einrichten und laden Sie das Paket herunter. Beispiel: bot-command-advanced-classifier-<version>.jar.
- Sie müssen dieses Paket in den Control Room hochladen. Weitere Informationen finden Sie unter Pakete zum Control Room hinzufügen.
- Wenn Sie die Aktionen des „Erweiterter Klassifizierer“-Pakets verwenden, achten Sie darauf, dass die Eingabe- und Ausgabepfade Folgendes nicht enthalten:
- Sonderzeichen in einer Sequenz. Zum Beispiel C:\Documents and Settings\user1\My Documents\AdvanceClassifier-_@#!^&()=+-~`][12.
- Die in den Pfaden verwendeten Ordnernamen enthalten keine der folgenden Zeichen: , \' #.
Aktionen im Advanced Classifier-Paket
Das Paket enthält die Advanced Classifier trainieren, Dokument klassifizieren, Seiten klassifizieren und Dokument unterteilen-Aktionen. Sie können diese Aktionen verwenden, um eine Modelldatei zu erstellen und die Datei zu verwenden, um hochgeladene Dokumente in verschiedenen Ordnern zu klassifizieren. Diese Aktionen dienen als Vorstufe zur Dokumentenverarbeitung.
Aktionen | Beschreibung |
---|---|
Advanced Classifier trainieren | Verwenden Sie die Aktion Advanced Classifier trainieren, um eine Modelldatei zu erstellen, die von der Aktion Dokumente klassifizieren, Seiten klassifizieren oder Dokument unterteilen verwendet wird, um die Dokumente in die für die Eingabe erforderlichen Kategorien zu sortieren. Weitere Informationen finden Sie unter Aktion „Advanced Classifier trainieren“ verwenden. |
Dokument klassifizieren | Die Dokument klassifizieren-Aktion gruppiert die Eingabedokumente auf der Grundlage der ersten Seite jedes Dokuments unter Verwendung der ausgewählten Modelldatei, die mit der Advanced Classifier trainieren-Aktion erstellt wurde. Einzelheiten finden Sie unter Verwenden der Aktion „Dokument klassifizieren“. |
Seiten klassifizieren | Die Seiten klassifizieren-Aktion gruppiert die Seiten eines Eingabedokuments auf der Grundlage der Modelldatei, die mit Advanced Classifier trainieren-Aktion erstellt wurde, und filtert die Seiten heraus, die nicht in das Modell passen. Weitere Informationen finden Sie unter Verwenden der Aktion „Seiten klassifizieren“. |
Dokument aufteilen | Verwenden Sie die Aktion Dokument aufteilen, um das Eingabedokument auf der Grundlage des ausgewählten Klassifizierungsmodells in mehrere Dokumente aufzuteilen. Weitere Informationen finden Sie unter Verwendung der Aktion „Dokument unterteilen“. |
Das Advanced Classifier-Paket nutzt Tesseract OCR für die bildbasierte Klassifizierung. Eine ausführliche Liste der von Tesseract OCR unterstützten Sprachen finden Sie unter Unterstützte Sprachen für Tesseract OCR.