Dieses Thema beschreibt die Möglichkeit, Regeln für die Klassifizierung von Dokumenten oder Seiten einzurichten.

Verstehen von Regeln und deren Anwendung

Mithilfe einer Regel wird die Kategorie bestimmt, der ein Dokument zugewiesen werden soll. Im folgenden Beispiel kann eine Regel einen bestimmten Ausdruck angeben, z. B. Anlage. Wenn die Regel auf den Text des Dokuments angewendet wird und dieser Ausdruck gefunden wird, erhält die mit der Regel verbundene Kategorie eine hohe Punktzahl, z. B. 80, was auf eine hohe Übereinstimmung hinweist.
[
{
"DocumentTypeID": 0,
"Location": 0,
"Distance": 1,
"Score": 80,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
}
}
]

Regeln sind nützlich, wenn zusätzliche Hinweise benötigt werden, um die Genauigkeit eines Klassifizierungsmodells bei der Bestimmung der relevantesten Dokumentenkategorie zu verbessern. Obwohl es technisch möglich ist, die gesamte Klassifizierung mit Regeln vorzunehmen, ist dies nicht die beste Vorgehensweise. Die Verwaltung der Regelkonfiguration stellt einen erheblichen Mehraufwand dar, insbesondere wenn es um eine große Anzahl von Kategorien geht.

Beispiel für eine Regeldatei

Eine Regeldatei ist ein json-Schema und liegt im json-Format vor, wie unten angegeben. Für die Datei <Dateiname>.json können mehrere Regeln eingerichtet werden. Damit ein Dokument im Trainingsprozess für die Klassifizierung berücksichtigt werden kann, muss es in einer bestimmten Trainingsordnerkategorie abgelegt werden, zum Beispiel C:\Invoice\Vendor1.
[
{
"DocumentTypeID": 0,
"Location": 1,
"Distance": 3,
"Score": 90,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": true,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Terms & Conditions",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Payment Terms",
"IsNegativePhrase": false,
"PhraseType": 1
}
]
},
{
"DocumentTypeID": 2,
"Location": 2,
"Distance": 1,
"Score": 95,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Addendum",
"IsNegativePhrase": true,
"PhraseType": 5
}
]
}
]

Konfigurierbare Eigenschaften einer Regeldatei