Advanced Classifier-package
- Zuletzt aktualisiert2025/02/03
Advanced Classifier-package
Mit dem Advanced Classifier-package können Sie Dokumente in einer Ordnerstruktur klassifizieren. Sie können die Dokumente aus den Ordnern in die jeweilige Lerninstanz zur Inhaltsextraktion in Document Automation hochladen.
- Laden Sie das Advanced Classifier-package vom A-People Downloadportal A-People Downloads page (Login required) herunter. Klicken Sie zum Abrufen dieses packages auf eine bestimmte Automation 360 IQ Bot-Version > Installation einrichten und laden Sie das package herunter. Beispiel: bot-command-advanced-classifier-<version>.jar. Informationen zum manuellen Hinzufügen eines packages zum Control Room finden Sie unter packages zum Control Room hinzufügen.
- Wenn Sie die Aktionen des „Erweiterter Klassifizierer“-packages verwenden, achten Sie darauf, dass die Eingabe- und Ausgabepfade Folgendes nicht enthalten:
- Sonderzeichen in einer Sequenz. Zum Beispiel C:\Documents and Settings\user1\My Documents\AdvanceClassifier-_@#!^&()=+-~`][12.
- Die in den Pfaden verwendeten Ordnernamen enthalten keine der folgenden Zeichen: , \' #.
Actions im Advanced Classifier-package
Das Paket enthält die Advanced Classifier trainieren, Dokument klassifizieren, Seiten klassifizieren und Dokument unterteilen-actions. Sie können diese actions verwenden, um eine Modelldatei zu erstellen und die Datei zu verwenden, um hochgeladene Dokumente in verschiedenen Ordnern zu klassifizieren. Diese actions dienen als Vorstufe zur Dokumentenverarbeitung.
Actions | Beschreibung |
---|---|
Advanced Classifier trainieren | Verwenden Sie die Aktion Advanced Classifier trainieren, um eine Modelldatei zu erstellen, die von der Aktion Dokumente klassifizieren, Seiten klassifizieren oder Dokument unterteilen verwendet wird, um die Dokumente in die für die Eingabe erforderlichen Kategorien zu sortieren. Weitere Informationen finden Sie unter action „Advanced Classifier trainieren“ verwenden. |
Dokument klassifizieren | Die Dokument klassifizieren-action gruppiert die Eingabedokumente auf der Grundlage der ersten Seite jedes Dokuments unter Verwendung der ausgewählten Modelldatei, die mit der Advanced Classifier trainieren-action erstellt wurde. Einzelheiten finden Sie unter Verwenden der action „Dokument klassifizieren“. |
Seiten klassifizieren | Die Seiten klassifizieren-action gruppiert die Seiten eines Eingabedokuments auf der Grundlage der Modelldatei, die mit Advanced Classifier trainieren-action erstellt wurde, und filtert die Seiten heraus, die nicht in das Modell passen. Weitere Informationen finden Sie unter Verwenden der action „Seiten klassifizieren“. |
Dokument aufteilen | Verwenden Sie die Aktion Dokument aufteilen, um das Eingabedokument auf der Grundlage des ausgewählten Klassifizierungsmodells in mehrere Dokumente aufzuteilen. Weitere Informationen finden Sie unter Verwendung der Aktion „Dokument unterteilen“. |
Das Advanced Classifier-package nutzt Tesseract OCR für die bildbasierte Klassifizierung. Eine ausführliche Liste der von Tesseract OCR unterstützten Sprachen finden Sie unter Unterstützte Sprachen für Tesseract OCR.