Über den Klassifikator

Erfahren Sie, wie Dokumente klassifiziert werden und welche Faktoren die Klassifizierung beeinflussen.

Wenn Dokumente in eine Lerninstanz hochgeladen werden, sortiert der Klassifikator die Dokumente auf der Grundlage des Layouts, d. h. der Reihenfolge, in der die Felder auf der Seite erscheinen, in Dokumentgruppen. Wenn ein Dokument in eine Lerninstanz in der Produktion hochgeladen wird und das Dokument nicht dem Layout einer der Dokumentgruppen entspricht, erstellt der Klassifikator eine neue Gruppe für dieses Dokument.

Die folgende Grafik veranschaulicht, wie hochgeladene Rechnungen, die bestimmte Felder enthalten, in eine von drei Gruppen sortiert werden, je nach der Reihenfolge, in der die Felder in der Rechnung erscheinen.

Der Klassifikator sortiert die Dokumente anhand des Layouts

Alternativ können Sie auch manuell eine Dokumentgruppe definieren, um alle Dokumente mit identischem Layout zu verarbeiten. In diesem Fall umgeht IQ Bot den Klassifikator und sendet das Dokument an die von Ihnen erstellte Gruppe, die das gleiche Layout wie das hochgeladene Dokument hat. Diese Option ist nützlich, wenn die OCR ein oder mehrere Felder in einem Dokument nicht erkennt, sodass der Klassifikator unnötigerweise eine neue Dokumentgruppe erstellt oder das Dokument an die falsche Gruppe sendet. Einzelheiten finden Sie unter Erstellen einer neuen Dokumentgruppe.
Anmerkung: Vom Nutzer erstellte Dokumentgruppen können nicht gelöscht werden.
Der Klassifizierer wird von RPA-Bots und dem Dokumentenklassifizierer-Paket unterstützt. Er enthält Aktionen, die die Identifizierung und Sortierung der verschiedenen Dokumenttypen automatisieren. Einzelheiten finden Sie unter Dokumentenklassifizierer Paket.

Ressourcen

Sehen Sie sich die folgenden Videos an, um mehr über die Funktionsweise und die Verwendung des Klassifizierers zu erfahren:

Lerninstanzen, die mit vordefinierten oder benutzerdefinierten Domänen erstellt wurden

IQ Bot prüft, ob eine Mindestanzahl von Feldern vorhanden ist, die Sie für die erfolgreiche Klassifizierung des Dokuments ausgewählt haben. In allen anderen Fällen wird das Dokument als nicht klassifiziert markiert.

Beispiel:

  • Wenn Sie eine neue Lerninstanz mit ein bis vier ausgewählten Feldern erstellen, sucht IQ Bot nach mindestens vier Feldern aus der Gesamtzahl der Felder, die für diese bestimmte Lerninstanz angezeigt werden. Wenn Sie eine Lerninstanz mit fünf ausgewählten Feldern erstellen, sucht IQ Bot nach mindestens fünf Feldern.
  • Wenn Sie eine Lerninstanz mit sechs oder mehr Feldern erstellen, die in der Lerninstanz ausgewählt sind, sucht IQ Bot nach mindestens sechs Feldern. Wenn Sie beispielsweise acht Felder in einer Rechnungsdomäne ausgewählt haben, prüft IQ Bot, ob mindestens sechs Felder von den insgesamt verfügbaren Feldern vorhanden sind.

Lerninstanzen, die mit anderen Domänen erstellt wurden

Wenn Sie eine Lerninstanz mit mehreren Feldern erstellen, sucht IQ Bot nach mindestens einem Feld und klassifiziert das Dokument. Wenn IQ Bot kein Feld findet, wird das Dokument als nicht klassifiziert markiert.

Faktoren, die sich auf die Klassifizierung auswirken

Faktor Anmerkungen
Seitenlayout Wenn sich das Seitenlayout in Bezug auf die Position des Dokumentinhalts vom Originaldokument unterscheidet, sendet IQ Bot das Dokument an eine andere Gruppe.
Ausrichtung der Bezeichnungen Alle Bezeichnungen in einem Dokument müssen in die gleiche Richtung ausgerichtet sein. Wenn einige der Bezeichnungen vertikal und einige horizontal sind, wird das Dokument an eine andere Gruppe gesendet.
Position der Bezeichnungen Bezeichnungen können an einer beliebigen Stelle auf der Seite positioniert werden. Die Reihenfolge der Bezeichnungen von links nach rechts und von oben nach unten muss jedoch mit der Reihenfolge in den Trainingsdokumenten übereinstimmen.
Übereinstimmungs-Prozentsatz IQ Bot verwendet eine 70%ige Übereinstimmung für Bezeichnungen.
Felder, die nach der Erstellung der Lerninstanz hinzugefügt wurden Felder, die nach der Erstellung einer Lerninstanz hinzugefügt wurden, werden vom Klassifizierungsprozess ausgeschlossen.