文档分类器 package 将文档分组或分类到适当的学习实例中,以便提取内容。

使用此 package 执行以下任务:

  • 根据布局、内容或两者,将文档文件中的页面分组到不同的文件夹中。
  • 根据布局、内容或两者,从第一页将文档文件中的文档分组到不同的文件夹中。

使用此 package 是可选的,仅在您需要将不同的文档按文档级别或页面级别分组到单独的文件夹中时才需要。

注: 分类器(页数)许可证是使用此 package 处理文件所必需的。

文档分类器 package 提供以下功能:

训练模型
使您能够创建模型并训练模型以对文档和页面进行分类。
分类文档
使您能够根据每个文档的布局、内容或两者,从第一页开始将文档文件分类到不同的文件夹中。
分类页面
使您能够将文档中的页面分到不同的文件夹中,并根据布局、内容或两者过滤页面。

要了解高级分类器和文档分类器之间的差异,请参见 Advanced Classifier 与 Document Classifier 对比