Configurar regras para classificar documentos ou páginas
- Última atualização2024/10/31
Configurar regras para classificar documentos ou páginas
Este tópico descreve o recurso de configuração de regras para classificar documentos ou páginas.
Compreensão das regras e seu uso
[
{
"DocumentTypeID": 0,
"Location": 0,
"Distance": 1,
"Score": 80,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
}
}
]
As regras são úteis quando é necessária uma orientação adicional para aumentar a precisão de um modelo de classificação na determinação da categoria de documento mais relevante. Embora tecnicamente seja possível fazer toda a classificação usando regras, essa não é a melhor prática, pois o gerenciamento da configuração das regras se torna uma sobrecarga significativa, especialmente quando se lida com um grande número de categorias.
Exemplo de um arquivo de regras
[
{
"DocumentTypeID": 0,
"Location": 1,
"Distance": 3,
"Score": 90,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": true,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Terms & Conditions",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Payment Terms",
"IsNegativePhrase": false,
"PhraseType": 1
}
]
},
{
"DocumentTypeID": 2,
"Location": 2,
"Distance": 1,
"Score": 95,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Addendum",
"IsNegativePhrase": true,
"PhraseType": 5
}
]
}
]
Propriedades configuráveis de um arquivo de regras
Configuração | Descrição |
---|---|
DocumentTypeID |
Atualmente, esse campo não é compatível. Para qualquer regra que esteja sendo configurada, pode ser mantido um texto estático como 0 . |
Location |
Essa configuração especifica em qual local do texto do documento a regra é aplicável. Os valores podem ser 0, 1, 2 ou 3.
|
Distance |
Essa configuração especifica a distância entre as frases quando a pesquisa é feita no texto do documento. A regra só corresponderá se a distância for a especificada com base nessa configuração. Os valores podem ser 0, 1, 2 ou 3.
|
Score |
Depois que uma correspondência de regra é realizada, uma pontuação é atribuída à categoria (ou pasta de treinamento) associada a essa regra. O valor da pontuação pode variar de -100 a 100. |
KBGuid |
Atualmente, esse campo não é compatível. Para qualquer regra que esteja sendo configurada, pode ser mantido um texto estático como 00000000-0000-0000-0000-000000000000 |
IsEnabled |
Isso permite que a regra seja ativada ou desativada com a configuraçãotrue OU false , respectivamente. |
ExpectExactSequence |
Ao procurar várias frases em uma regra, essa configuração especifica a correspondência baseada em sequência exata. Por exemplo, se for definido
true no exemplo,"Text": "Annexure" , "Text": "Terms & Conditions" e "Payment Terms" devem estar presentes no texto do documento nessa ordem para que a regra corresponda. É possível que haja outro texto entre essas frases, mas é importante que a ordem dessas frases seja consecutiva, uma após a outra.Nota: A menos que esteja muito claro que a sequência esperada seguirá um padrão específico, recomenda-se manter essa configuração como false |
|
O |
Text |
Text : especifica o valor do texto da frase que precisa ser pesquisado no texto do documento |
IsNegativePhrase |
IsNegativePhrase : especifica se a condição de pesquisa é um tipo de pesquisa de frase negativa. Quando definido como true no exemplo, isso significa que "Text": "Addendum" não está presente no texto do documento para que a regra seja correspondida. |
PhraseType |
PhraseType especifica o tipo de correspondência que será usado quando o valor do texto da frase for comparado com o texto do documento
|