使用训练高级分类器 操作

使用训练高级分类器 操作 创建分类文档分类页面拆分文档 操作 所使用的模型文件,将文档分类至所需的类别以供输入。

先决条件

在构建机器人之前,收集示例文档并将其分类到文件夹中。 确保示例文档集符合以下要求:
  • 确保您已购买 Advanced Classifier 许可证。 联系 Automation Anywhere 支持人员:Open a support case (A-People login required)。 请参阅 了解 文档自动化 中的许可证
  • 确保您已配置您的许可证密钥。 请参阅 为高级分类器软件包配置自带密钥 (BYOK)
  • 至少有两个类别。
  • 每个类别至少需要 15 个文件,建议每个类别有 20 个文件。
  • 类别的最大数量没有限制。 然而,需要注意的是,随着训练数据集和相应模型尺寸的增加,分类过程的性能可能会下降。 因此,建议将每个模型文件中的类别数量保持在 150 个以内,以获得最佳性能。
  • 支持的文件格式如下所示:
    • .tiff
    • .bitmap
    • .jpeg
    • .png
    • .pdf
    • .txt
  • 我们建议您提供分辨率为 300 dpi(每英寸点数)的图像。 最低可接受的分辨率是 200 dpi。
注:

如果未满足这些最低要求,在机器人运行时会显示一条错误消息。

过程

  1. 操作面板中,双击或拖动高级分类器包中的训练高级分类器操作。
  2. 型号名称字段中输入型号文件的名称。
  3. 桌面文件夹变量中选择训练文件夹路径。 输入文件夹路径必须具有与您要训练分类器的文档类别对应的名称的子目录。 例如,如果您有销售相关的文档,则输入文件夹路径必须包含子文件夹,如 Invoice 和 Purchase Order。
  4. 可选: 如果选择桌面文件,请单击浏览,更改默认文件路径。 例如,C:\Users\Dave\BankStatement\TrainingData
  5. 使用型号输出路径字段选择输出模型文件的目录。
  6. 许可证字段中,提供许可证凭据。
  7. 如果您选择凭据选项,请单击选择以从许可证储存柜中获取许可证。
  8. 文档拆分训练字段中:
    如果您选择禁用
    1. 在高级设置中,根据您要构建的分类器类型,从下拉菜单中选择分类类型
      • 视觉分类器
      • 内容分类器
      • 视觉和内容分类器
    2. 可选: 添加文本规则
    如果您选择已启用
    1. 您将看到以下选项:
      • 合并未知文档 - 默认未选中。
      • 未知页面阈值 - 默认为 30%
      • 拆分置信度阈值(或分离拆分阈值)- 默认为 70%。
    2. 在高级设置中,根据您要构建的分类器类型,从下拉菜单中选择分类类型
      • 视觉分类器
      • 内容分类器
      • 视觉和内容分类器
    3. OCR 类型字段中,选择一个 OCR 引擎进行分类。
    4. 可选: 添加文本规则
    注: 每个类别必须只能有一个规则文件。 如果规则文件放置在类别文件夹之外,则会显示以下错误消息: 无效的规则文件位置
  9. 单击保存运行

后续步骤

在创建模型后,构建一个机器人对输入文档进行分类。 有关更多信息,请参阅 使用分类文档 操作