이 항목에서는 문서 또는 페이지 분류 규칙을 설정하는 기능에 대해 설명합니다.

규칙 및 사용법 이해

문서를 할당해야 하는 카테고리를 결정하는 데 규칙이 사용됩니다. 아래 예에서 규칙은 Annexure와 같은 특정 구문을 지정할 수 있으며 규칙이 문서 텍스트에 적용될 때 해당 구문이 발견되면 규칙과 관련된 카테고리에 80과 같은 높은 점수가 할당되어 강력한 일치를 나타냅니다.

[
{
"DocumentTypeID": 0,
"Location": 0,
"Distance": 1,
"Score": 80,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
}
}
]

규칙은 가장 관련 있는 문서 카테고리를 결정할 때 분류 모델의 정확도를 향상시키는 데 추가 지침이 필요할 때 유용합니다. 기술적으로는 규칙을 사용하여 모든 분류를 수행할 수 있지만 특히 많은 수의 카테고리를 처리할 때 규칙 구성 관리가 시간이 지남에 따라 상당한 오버헤드가 되기 때문에 모범 사례는 아닙니다.

규칙 파일의 예

규칙 파일은 json 스키마이며 아래에 지정된 json 형식입니다. <filename>.json에는 여러 규칙 설정이 있을 수 있습니다. 분류 트레이닝 프로세스 중에 문서를 고려하려면 지정된 트레이닝 폴더 카테고리(예: C:\Invoice\Vendor1)에 배치되어야 합니다.

[
{
"DocumentTypeID": 0,
"Location": 1,
"Distance": 3,
"Score": 90,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": true,
"TextRulePhrases": [
{
"Text": "Annexure",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Terms & Conditions",
"IsNegativePhrase": false,
"PhraseType": 1
},
{
"Text": "Payment Terms",
"IsNegativePhrase": false,
"PhraseType": 1
}
]
},
{
"DocumentTypeID": 2,
"Location": 2,
"Distance": 1,
"Score": 95,
"KBGuid": "00000000-0000-0000-0000-000000000000",
"IsEnabled": true,
"ExpectExactSequence": false,
"TextRulePhrases": [
{
"Text": "Addendum",
"IsNegativePhrase": true,
"PhraseType": 5
}
]
}
]

규칙 파일의 구성 가능한 속성