关于分类器
- Updated: 2022/02/03
了解文档的分类方式以及影响分类的因素。
在将文档上传到学习实例后,分类器根据布局将文档分类到文档组中,布局是字段在页面上显示的顺序。 如果将文档上传到实际正式的学习实例,并且文档与任何文档组的布局都不匹配,则分类器会为该文档创建一个新组。
下图说明了上传的包含特定字段的发票如何根据字段在发票中的显示顺序分为三个组之一。
或者,您可以手动定义一个文档组,以处理具有相同布局的所有文档。 在这种情况下,IQ Bot 绕过分类器并将文档发送到您创建的与上传的文档具有相同布局的组。 当 OCR 未能检测到文档中的一个或多个字段,导致分类器创建了多余的新文档组或将文档发送到错误的组时,此选项很有用。 请参阅 创建新文档组。
注: 无法删除用户创建的文档组。
RPA bots 和 Document Classifier
package 支持使用分类器。 分类器包含 actions,可用于自动识别和分类不同类型的文档。 请参阅 Document Classifier package。资源
观看以下视频,了解更多关于分类器工作原理及其使用方法的信息:
使用现成可用或自定义域创建的学习实例
IQ Bot 将检查您选择的最少字段数以成功对文档进行分类。 在所有其他情况下,文档将标记为未分类。
例如:
- 如果您在创建新学习实例时选择了一到四个字段,IQ Bot 则从为该特定学习实例存在的字段总数中检查至少四个字段。 类似地,如果您在创建学习实例时选择了五个字段,则 IQ Bot 会检查至少五个字段。
- 如果您在创建学习实例时选择了学习实例中的六个或更多字段,则 IQ Bot 会检查至少六个字段。 例如,如果您在发票域中选择了八个字段,则 IQ Bot 会检查总可用字段中的至少有六个字段。
使用其他域创建的学习实例
如果您在创建学习实例时使用了多个字段,则 IQ Bot 会检查至少一个字段并对文档进行分类。 如果 IQ Bot 找不到任何字段,文档将标记为未分类。
影响分类的因素
因素 | 备注 |
---|---|
页面布局 | 如果页面布局在文档内容位置方面与原始文档不同,则 IQ Bot 会将文档发送到不同的组。 |
标签方向 | 文档中的所有标签必须朝向相同的方向。 如果有些标签是垂直的,有些是水平的,则文档将发送到不同的组。 |
标签位置 | 标签可以放置在页面上的任何位置。 但是,从左到右、从上到下的标签顺序必须与培训文档中的相同。 |
匹配百分比 | IQ Bot 对标签使用 70% 匹配。 |
创建学习实例后添加的字段 | 创建学习实例后添加的字段将被排除在分类进程之外。 |