高级分类器 软件包
- Updated: 2025/02/03
高级分类器 软件包
高级分类器 软件包 使您能够将文档分类到文件夹结构中。 您可以将文件夹中的文档上传到相应的学习实例中,以便在 文档自动化 中提取内容。
注:
- 从 A-People 下载门户 A-People Downloads page (Login required) 下载高级分类器 软件包。 要获取此 软件包,请单击特定 Automation 360 IQ Bot 版本 > 安装设置并下载 软件包。 例如,bot-command-advanced-classifier-<version>.jar。 有关手动将 软件包 添加到 Control Room 的信息,请参阅 将 软件包 添加到 Control Room。
- 使用高级分类器 软件包 操作时,请确保输入和输出路径不包含以下内容:
- 序列中的特殊字符。 例如,C:\Documents and Settings\user1\My Documents\AdvanceClassifier-_@#!^&()=+-~`][12。
- 路径中使用的文件夹名称不包括以下字符:, ' #。
高级分类器 软件包 中的 操作
该软件包包含训练高级分类器、分类文档、分类页面和拆分文档 操作。 您可以使用这些 操作 创建模型文件,并使用该文件将上传的文档分类到不同的文件夹中。 这些 操作 作为文档处理的前体。
操作 | 描述 |
---|---|
训练高级分类器 | 使用培训高级分类器操作创建一个模型文件,该文件由分类文档、分类页面或拆分文档操作使用,以将文档分类至所需的类别以供输入。 有关更多信息,请参阅 使用训练高级分类器 操作。 |
分类文档 | 使用通过训练高级分类器 操作 创建的选定模型文件,分类文档 操作 根据每个文档的第一页对输入文档进行分组。 有关详细信息,请参阅 使用分类文档 操作。 |
分类页面 | 分类页面 操作 根据使用训练高级分类器 操作 创建的模型文件对输入文档的页面进行分组,并过滤掉不符合模型的页面。 有关更多信息,请参阅 使用分类页面 操作。 |
拆分文档 | 使用拆分文档操作,根据选定的分类模型将输入文档分成多个文档。 有关更多信息,请参阅 使用拆分文档操作。 |
注:
高级分类器 软件包 利用 Tesseract OCR 进行基于图像的分类。 有关 Tesseract OCR 支持的语言的详细列表,请参阅 Tesseract OCR 支持的语言。