使用分类页面 操作

分类页面 操作 功能根据使用高级分类器训练 操作 创建的模型文件对输入文档的页面进行分组,并过滤掉不符合模型的页面。

先决条件

  • 如果尚未完成,请使用训练高级分类器操作来创建模型文件。
  • 确保输入文件是所需的格式。

使用循环操作中的分类页面操作构建一个机器人,以迭代地对所选文件夹中的每个文件进行分类。

过程

  1. 操作面板中,双击或拖动高级分类器包中的页面分类操作。
  2. 输入文件字段中,提供用于分类的传入文件的默认文件路径:
    • Control Room 文件
    • 桌面文件
    • 变量
  3. 分类器字段中,提供模型文件的文件路径。 您可以选择 .zip 文件夹,或者从该文件夹中提取 .clsproj3 文件并选择它。
    • Control Room 文件
    • 桌面文件
    • 变量
  4. 使用输出文件夹路径选项保存分类输出文档。 输出文档的页面将根据在模型文件中创建的类别保存在相应的子文件夹中。
    • 桌面文件夹
    • 变量
  5. 许可证字段中,提供许可证凭据。
  6. 如果您选择凭据选项,请单击选择以从许可证储存柜中获取许可证。
  7. 可选: 配置以下内容:
    保存分类输出变量: 使用以下键将分类结果保存为字典列表:
    • 文件名: 您要处理的文件名称以及附加的索引值。 例如,<<file name_pageIndex>>
    • 索引: 当您有多个页面时的页码值
    • 类别: 文件分类后所属的类别。 例如,所有与人力资源相关的文件将被放置在一个类别中。
    • 置信度: 用于显示分类的阈值百分比,例如,根据训练数据确定哪个文件属于哪个类别。
    注:
    • 您可以在高级分类器中选择分类类型:
      • 基于图像的分类
      • 基于文本的分类
      • 基于图像和文本的分类
  8. 单击保存运行

后续步骤

您可以使用每个包含相似文档的子文件夹来创建和训练一个学习实例,以从文档中提取数据。