使用拆分文档操作,根据选定的分类模型将输入文档分成多个文档。

先决条件

  • 如果尚未完成,请使用训练高级分类器操作来创建模型文件。
  • 确保输入文件是所需的格式。

要将文档拆分为多个文档,请执行以下操作:

过程

  1. 操作面板中,双击或拖动高级分类器软件包中的拆分文档 action
    注: 仅支持多页的 PDF 和 TIFF 文档作为拆分文档 action 的唯一有效输入。
  2. 输入文件路径中,选择以下选项之一以指定输入文件的位置:
    • Control Room 文件
    • 桌面文件
    • 变量
  3. 使用输出文件夹路径选项保存分类输出文档。
    • 桌面文件夹
    • 变量
  4. 许可证字段中,提供许可证凭据。
  5. 如果您选择凭据选项,请单击选择从凭据保管库中提供许可证。
  6. 使用保存拆分输出变量选项来保存分类输出文档。 使用以下键将分类结果保存为字典列表:
    • fileName: 要处理的文件名
    • documentIndex: 文件编号(按类别划分)
    • pageIndex: 页码(按文档划分)
    • 类别: 文件分类后所属的类别。 例如,所有与人力资源相关的文件将被放置在一个类别中。
    • classConfidence: 系统基于训练数据对文档进行分类,并识别出显示分类的阈值百分比,例如,哪个文件属于哪个类别。
    • splitConfidence: 系统基于训练数据将文档拆分为不同的类别,并识别出显示分类拆分置信度的拆分百分比值。
  7. 单击保存运行