Établir des règles de classification des documents ou des pages
- Dernière mise à jour2024/10/31
Établir des règles de classification des documents ou des pages
Cette rubrique explique comment définir des règles de classification des documents ou des pages.
Comprendre les règles et leur utilisation
[
{
"DocumentTypeID": 0,
"Location": 0,
"Distance": 1,
"Score": 80,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
}
}
]
Les règles sont utiles lorsqu'une orientation supplémentaire est nécessaire pour améliorer la précision d'un modèle de classification dans la détermination de la catégorie de document la plus pertinente. Bien qu'il soit techniquement possible d'effectuer toutes les classifications à l'aide de règles, il ne s'agit pas de la meilleure pratique, car la gestion de la configuration des règles implique des frais importants dans le temps, en particulier lorsqu'il s'agit de traiter un grand nombre de catégories.
Exemple de fichier de règles
[
{
"DocumentTypeID": 0,
"Location": 1,
"Distance": 3,
"Score": 90,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": true,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Terms & Conditions",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Payment Terms",
"IsNegativePhrase": false,
"PhraseType": 1
}
]
},
{
"DocumentTypeID": 2,
"Location": 2,
"Distance": 1,
"Score": 95,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Addendum",
"IsNegativePhrase": true,
"PhraseType": 5
}
]
}
]
Propriétés configurables d'un fichier de règles
Configuration | Description |
---|---|
DocumentTypeID |
Actuellement, ce champ n'est pas pris en charge. Pour une règle en cours d'élaboration, il est possible de conserver un texte statique sous la forme 0 . |
Location |
Cette configuration spécifie à quel endroit du texte du document la règle s'applique. Les valeurs peuvent être 0, 1, 2 ou 3.
|
Distance |
Cette configuration spécifie la distance entre les phrases lorsque la recherche est effectuée sur le texte du document. La règle ne s'applique que si la distance est celle spécifiée dans cette configuration. Les valeurs peuvent être 0, 1, 2 ou 3.
|
Score |
Lorsqu'une correspondance de règle est effectuée, une note est attribuée à la catégorie (ou au dossier d'entraînement) associée à cette règle. La valeur de la note peut varier de -100 à 100. |
KBGuid |
Actuellement, ce champ n'est pas pris en charge. Pour une règle en cours d'élaboration, il est possible de conserver un texte statique sous la forme 00000000-0000-0000-0000-000000000000 |
IsEnabled |
Cela permet d'activer ou de désactiver la règle en définissant respectivementtrue OU false . |
ExpectExactSequence |
Lors de la recherche de plusieurs phrases dans une règle, cette configuration spécifie une correspondance basée sur la séquence exacte. Par exemple, si
true est défini dans l'exemple,"Text": "Annexure" , "Text": "Terms & Conditions" et "Payment Terms" doivent être présents dans le texte du document dans cet ordre pour que la règle corresponde. Il est possible qu'un autre texte soit présent entre ces phrases, mais il est important que l'ordre de ces phrases soit consécutif, l'une après l'autre.Remarque : à moins qu'il apparaisse très clairement que la séquence attendue suivra un modèle spécifique, il est recommandé de conserver la configuration false |
|
|
Text |
Text spécifie les valeurs du texte de la phrase qui doivent être recherchées dans le texte du document |
IsNegativePhrase |
IsNegativePhrase spécifie si la condition de recherche est un type de recherche de phrase négative. Dans l'exemple, si la valeur true est attribuée, cela signifie que "Text": "Addendum" n'est pas présent dans le texte du document pour que la règle corresponde. |
PhraseType |
PhraseType spécifie le type de correspondance utilisé lorsque la valeur du texte de la phrase est comparée au texte du document
|