Establecer reglas para clasificar documentos o páginas
- Última actualización2023/10/19
Establecer reglas para clasificar documentos o páginas
En este tema, se describe la capacidad de establecer reglas para clasificar documentos o páginas.
Comprender las reglas y su uso
[
{
"DocumentTypeID": 0,
"Location": 0,
"Distance": 1,
"Score": 80,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
}
}
]
Las reglas son útiles cuando se necesita una orientación adicional para mejorar la precisión de un modelo de clasificación a la hora de determinar la categoría de documento más relevante. Aunque técnicamente es posible realizar toda la clasificación mediante reglas, no es la práctica recomendada, ya que la gestión de la configuración de las reglas se convierte en una importante sobrecarga de trabajo, en especial cuando se trata de una gran cantidad de categorías.
Ejemplo de un archivo de reglas
[
{
"DocumentTypeID": 0,
"Location": 1,
"Distance": 3,
"Score": 90,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": true,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Terms & Conditions",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Payment Terms",
"IsNegativePhrase": false,
"PhraseType": 1
}
]
},
{
"DocumentTypeID": 2,
"Location": 2,
"Distance": 1,
"Score": 95,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Addendum",
"IsNegativePhrase": true,
"PhraseType": 5
}
]
}
]
Propiedades configurables de un archivo de reglas
Configuración | Descripción |
---|---|
DocumentTypeID |
Actualmente, este campo no es compatible. Para cualquier regla que esté en configuración se puede mantener texto estático como 0 . |
Location |
Desde esta configuración se especifica en qué ubicación del texto del documento se aplica la regla. Los valores pueden ser 0, 1, 2 o 3.
|
Distance |
Desde esta configuración, se especifica la distancia entre frases cuando se realiza la búsqueda en el texto del documento. La regla solo coincidirá si la distancia es la especificada en esta configuración. Los valores pueden ser 0, 1, 2 o 3.
|
Score |
Una vez que se realiza la coincidencia de una regla, se asigna una puntuación a la categoría (o carpeta de entrenamiento) asociada a dicha regla. El valor de la puntuación puede estar entre -100 y 100. |
KBGuid |
Actualmente, este campo no es compatible. Para cualquier regla que esté en configuración, se puede mantener texto estático como 00000000-0000-0000-0000-000000000000 |
IsEnabled |
Esto permite habilitar o inhabilitar la regla con la configuración detrue O false , respectivamente. |
ExpectExactSequence |
Cuando se buscan varias frases en una regla, desde esta configuración se especifica la coincidencia basada en la secuencia exacta. Por ejemplo, si se establece
true en el ejemplo,"Text": "Annexure" , "Text": "Terms & Conditions" , y "Payment Terms" deben estar presentes en el texto del documento en este orden para que la regla coincida. Es posible que haya otro texto entre estas frases, pero es importante que su orden sea consecutivo, con una a continuación de la otra.Nota: A menos que esté muy claro que la secuencia esperada seguirá un patrón específico, se recomienda conservar esta configuración en false |
|
|
Text |
Text : especifica el valor de texto de la frase que debe buscarse en el texto del documento |
IsNegativePhrase |
IsNegativePhrase : especifica si la condición de búsqueda es de tipo frase negativa. Cuando se establece true en el ejemplo, esto significará que "Text": "Addendum" no está presente en el texto del documento para que la regla coincida. |
PhraseType |
PhraseType especifica el tipo de coincidencia que se usará cuando se busque el valor de texto de la frase en el texto del documento
|