Übersicht zur Dokumentklassifizierung
- Zuletzt aktualisiert2024/10/31
Übersicht zur Dokumentklassifizierung
Bei der Dokumentklassifizierung handelt es sich um einen automatisierten Prozess, der mithilfe von Klassifizierungspaketen durchgeführt wird, um Dokumente oder Seiten innerhalb eines Dokuments anhand ihrer Attribute wie Layout, Inhalt oder beidem in verschiedene Kategorien zu gruppieren oder zu klassifizieren.
Sie können diesen Prozess in Szenarien verwenden, in denen Sie Dokumente organisieren und anschließend die Dokumentverarbeitung ausführen müssen. So können Sie die Dokumente beispielsweise nach der Klassifizierung in entsprechenden Lerninstanzen weiterverarbeiten.
So funktioniert die Klassifizierung
Die Dokumentklassifizierung ermöglicht die Dokumentverarbeitung auf folgende Weise:
- Dokumente organisieren
- Wenn eine Datei zahlreiche Dokumente enthält, hilft die Dokumentklassifizierung dabei, die Dokumente in relevante Kategorien zu sortieren, sodass diese Dokumente einfach verwaltet und abgerufen werden können. Diese Dateien können Dokumente desselben Typs (z. B. Rechnungen) oder unterschiedlicher Art (z. B. Rechnungen, Konnossements und Einkaufsaufträge) enthalten.
- Optimierter Workflow
- Wenn der Klassifizierer die richtigen Dokumente identifiziert, können Sie die klassifizierten Dokumente im richtigen Dokumentverarbeitungs-Workflow verwenden und so die Dokumentidentifizierung und die Genauigkeit der Datenextraktion verbessern, z. B. durch die Verarbeitung von Dokumenten in geeigneten Lerninstanzen zur Datenextraktion.
- Erhöhte Effizienz
- Durch die Reduzierung des manuellen Aufwands zum Sortieren und Klassifizieren von Dokumenten spart die Dokumentklassifizierung Zeit und minimiert manuelle Fehler.
Arten von Klassifizierern
Sie können je nach Ihrem individuellen Anwendungsfall oder Ihren Geschäftsanforderungen eine der folgenden Klassifiziereroptionen auswählen.
- Dokumentenklassifizierer
-
Dieser Klassifizierer gruppiert Dokumente basierend auf der ersten Seite jedes Dokuments in verschiedene Kategorieordner (die Dokumentkategorien darstellen).
Darüber hinaus kann der Dokumentenklassifizierer auch einzelne Seiten innerhalb eines Dokuments in verschiedene Ordner klassifizieren. Wenn in das größere Dokument mehrseitige Dokumente eingebettet sind, müssen die einzelnen Seiten nach Abschluss dieser Klassifizierung auf Seitenebene zusammengeführt werden, um sie als einzelne Dokumente zu verarbeiten. Wenn beispielsweise ein Hypothekendokument auf Seite 1 und Seite 2 Kundeninformationen (Know Your Customer, KYC) und auf Seite 3 und Seite 4 Kundenkontoauszüge enthält, werden Seite 1 und Seite 2 als Kundeninformationen klassifiziert und im KYC-Ordner gespeichert und Seite 3 und Seite 4 werden als Kontoauszüge klassifiziert und im Kontoauszugsordner gespeichert. Um KYC-Seiten als einzelnes Dokument zu verarbeiten, müssen Sie die im KYC-Ordner gespeicherten Seiten 1 und 2 zusammenführen. Um den Kontoauszug als einzelnes Dokument zu verarbeiten, müssen Sie die im Kontoauszugsordner gespeicherten Seiten 3 und 4 zusammenführen.
- Advanced Classifier
- Dieser Klassifizierer ermöglicht zusätzlich zu den Funktionen des Dokumentklassifizierers das Aufteilen eines Dokuments in mehrere Dokumente und ermöglicht die Klassifizierung auf Dokument- oder Seitenebene anhand vordefinierter Regeln. Dafür ist eine separate Lizenz von Skilja erforderlich. Wir empfehlen Ihnen, diesen Klassifizierer nur zu verwenden, wenn der Dokumentklassifizierer Ihren Anforderungen nicht entspricht.
Informationen zum Unterschied zwischen dem Advanced Classifier und dem Dokumentklassifizierer finden Sie unter Vergleich zwischen Advanced Classifier und Document Classifier.