高级分类器 软件包

高级分类器 软件包 使您能够将文档分类到文件夹结构中。 您可以将文件夹中的文档上传到相应的学习实例中,以便在 文档自动化 中提取内容。

注:
  • 从 A-People 下载门户 A-People Downloads page (Login required) 下载高级分类器 软件包。 要获取此 软件包,请单击特定 Automation 360 IQ Bot 版本 > 安装设置并下载 软件包。 例如,bot-command-advanced-classifier-<version>.jar。 有关手动将 软件包 添加到 Control Room 的信息,请参阅 将 软件包 添加到 Control Room
  • 使用高级分类器 软件包 操作时,请确保输入和输出路径不包含以下内容:
    • 序列中的特殊字符。 例如,C:\Documents and Settings\user1\My Documents\AdvanceClassifier-_@#!^&()=+-~`][12
    • 路径中使用的文件夹名称不包括以下字符:, ' #
    当您在高级分类器 软件包 操作中使用此类路径并在 机器人 中执行时,您将看到一个错误。
.

高级分类器 软件包 中的 操作

该软件包包含训练高级分类器分类文档分类页面拆分文档 操作。 您可以使用这些 操作 创建模型文件,并使用该文件将上传的文档分类到不同的文件夹中。 这些 操作 作为文档处理的前体。

操作 描述
训练高级分类器 使用培训高级分类器操作创建一个模型文件,该文件由分类文档分类页面拆分文档操作使用,以将文档分类至所需的类别以供输入。 有关更多信息,请参阅 使用训练高级分类器 操作
分类文档 使用通过训练高级分类器 操作 创建的选定模型文件,分类文档 操作 根据每个文档的第一页对输入文档进行分组。 有关详细信息,请参阅 使用分类文档 操作
分类页面 分类页面 操作 根据使用训练高级分类器 操作 创建的模型文件对输入文档的页面进行分组,并过滤掉不符合模型的页面。 有关更多信息,请参阅 使用分类页面 操作
拆分文档 使用拆分文档操作,根据选定的分类模型将输入文档分成多个文档。 有关更多信息,请参阅 使用拆分文档操作
注:

高级分类器 软件包 利用 Tesseract OCR 进行基于图像的分类。 有关 Tesseract OCR 支持的语言的详细列表,请参阅 Tesseract OCR 支持的语言