IQ Bot Extraction package
IQ Bot Extraction package通过自动提取发票中的值,提供了增强的内容提取功能。
学习实例 IQ Bot 是一种环境,使您能够培训内容提取的样本文档。通过不断完善学习实例,您可以在整个生产环境中部署学习实例之前实现高内容提取准确性。
IQ Bot Extraction package 结合学习实例 (新的或现有的) 和经过预先培训的机器学习模型,自动提取内容。预培训的机器学习模型使用数据点从支持的文档类型中提取内容。通过为现有学习实例提供其他培训,您还可以从其他文档类型中提取内容。
IQ Bot Extraction package 提供以下提取方法:
内容提取,最少培训
IQ Bot Extraction package 设计为通过最少培训从特定文档类型 (如发票或采购订单) 提取值。
注: 对于这种内容提取方法,请确保始终使用 ABBYY FineReader Engine OCR 12.4 引擎。
考虑一种您希望从各种发票中提取销售数据的方案。通过选择用于提取数据的预培训域或文档类型来创建学习实例。在这种情况下,您可以选择文档类型作为发票,发票提供了一组用于内容提取的预设字段。确保上传了一份示例发票文档作为参考。不需要对学习实例组进行额外培训。使用 IQ Bot Extraction package 将此学习实例链接到 bot。然后,您可以运行此选项 bot 来根据各种发票的预设字段检索销售数据。
通过额外培训增强萃取能力
IQ Bot Extraction package 使用后端引擎与 IQ Bot 服务器的组合来增强文档提取。您可以使用现有的学习实例为所有可用文档组提供其他培训。通过自定义学习实例组的各个字段和验证设置,您可以跨 package 其他文档类型使用此内容提取。
重要: 此 package 不作为标准 Automation 360 IQ Bot 安装的一部分可用。要下载并安装此软件 package,请执行以下步骤:
- 从 package Automation Anywhere 支持网站下载。 package 是 IQ Bot 安装程序 文件夹中可用的 .jar 文件。
- 将上载 package 到 Control Room。
开始之前
- 确保使用 ABBYY FineReader Engine OCR 12.4 引擎创建学习实例。
OCR 其他可用发动机包括:
- Tesseract4 OCR
- Microsoft Azure Computer Vision OCR engine 3.2
- Tegaki (不适用于 Automation 360 IQ Bot Cloud)
- 选择具有通用布局的文档。
预培训模型包含逻辑组。为默认验证规则选择一个现有组非常重要,以避免 成功 文件夹中出现错误的文档。
IQ Bot Extraction package 中的 Action
观看以下视频,了解如何使用 IQ Bot Extraction package: