Advanced Classifier package 使您能够将文档分类到文件夹结构中,然后您可以从中将文档上传到相应的学习实例以在 Document Automation 中进行提取。

使用此 package 执行以下任务:

  • 根据布局、内容或两者,将文档文件中的页面分组到不同的文件夹中。
  • 根据布局、内容或两者,从第一页将文档文件中的文档分组到不同的文件夹中。
  • 根据所选分类模型将文档文件中的页面拆分到不同的文件夹中。

使用此 package 是可选的,仅在您需要将不同的文档按文档级别或页面级别进行分组,或将页面集拆分到单独的文件夹时才需要。

功能

Advanced Classifier package 提供以下功能:

训练模型
使您能够创建模型并训练模型以对文档和页面进行分类,并从文档中分割页面。
分类文档
使您能够根据每个文档的布局、内容或两者,从第一页开始将文档文件分类到不同的文件夹中。
分类页面
使您能够将文档中的页面分到不同的文件夹中,并根据布局、内容或两者过滤页面。
拆分文档
使您能够根据所选分类模型将文档中的页面拆分到不同的文件夹中。 分类模型经过训练,使用不同文档模式的样本来拆分文档的页面,并分析文档的第一页、中间页和最后一页。

使用 Advanced Classifier 拆分文档并对文档和页面进行分类

在什么情况下需要使用 Advanced Classifier 而不是 Document Classifier?

在以下场景中使用 Advanced Classifier package

  • 当您需要根据预定义规则对文档或页面进行分类时。 例如,如果一家医疗保健机构想要对包含发票和采购订单的文档进行分类,Advanced Classifier 会使用预定义的规则(如关键词)来对文档进行分类。 Advanced Classifier 通过识别文档中的关键词,如发票、账单或收据来对发票进行分类,并通过识别文档中的关键词,如采购订单、PO 或订单来对采购订单进行分类。
  • 当您需要根据特定模式从文档中拆分页面时。 例如,如果一家金融公司想要对包含发票、银行对账单、税务表格和收据的文档进行分类,Advanced Classifier 会使用布局和内容等模式来对文档进行分类,并将每种类型的页面分开。

要了解高级分类器和文档分类器之间的差异,请参阅 Advanced Classifier 与 Document Classifier 对比

您必须下载 Advanced Classifier package 并将 package 上传到 Control Room