IQ BotDocument Automation v.27 版本发布

查看 IQ BotDocument Automation v.27 版本中的新增内容、更改内容、修复内容及限制。

Document Automation

新增内容
标准表单与 Document Automation 集成

现在可以全程在 Document Automation 内创建和管理学习实例。 此前,需在 IQ Bot 中创建标准表单学习实例,然后通过 Document Automation 中的连接学习实例功能进行处理。 通过将标准表单与 Document Automation 集成,使整个工作流整合到单个系统中。

使用 Standard Forms 在 Document Automation 中创建自定义模型.

Document Automation 中支持 Azure AI Document Intelligence v3.0 模型

Azure AI Document Intelligence v3.0 为现有模型创建提供了更多功能,包括选择模板神经网络选项。 在训练模型时,可以选择 2.1 或 3.0 版本。

新的 Document Automation 产品许可证
Document Automation 现在提供以下许可证,使用户能够处理文档并跟踪实际正式环境中学习实例的指标:
  • Document Automation 标准表单(页数): 用于在 Document Automation 中创建模型并在标准表单中处理文档。
  • Document Automation 360 提取(页数): 用于处理 Automation Anywhere(预训练)模型中的文档,包括用户定义的文档类型。

此外,对许可证使用情况的跟踪机制也有更新。

许可证跟踪发布说明

使用 Google Vision OCR 提取数据

如果您是 Cloud Control Room 用户,则可通过创建或更新学习实例利用 Google Vision OCR 技术处理文档。

改进的 Automation Anywhere 模型表格提取功能

您可以使用验证反馈来训练学习实例,从包含多个字段的单元格中提取数据。

例如,如果产品描述列还包括项目编号,您可以在验证界面中勾勒出项目编号。 当学习实例处理后续文档时,它将提取项目编号并忽略产品描述。

使用验证反馈从表格中提取特定值

使用新的 Document Automation 小部件可视化性能指标

您可以查看验证器用户性能的数据可视化。 此新小部件是一个水平条形图,展示每个验证器用户每份文档执行手动验证所花费的加权平均时间。

文档工作区仪表板

Document Automation 支持基于正则表达式模式的提取

在配置学习实例将提取的字段时,您可以指定正则表达式 (regex) 模式来帮助提取引擎查找字段。 输入正则表达式模式后,您可以使用创建学习实例窗口中的示例内容测试表达式。 您可以对遵循特定模式的值(例如增值税号或采购订单号)使用正则表达式模式提取。

验证界面支持快捷键

在验证界面中,通过按住 Alt 键并滚动鼠标滚轮来放大和缩小文档。

更改内容
以下更新改变了 Control Room 跟踪许可证使用情况的方式:
  • Control Room 在部署 bot 之前会检查足够的产品许可证。
  • IQ Bot 页面许可证和标准表单页面许可证会跟踪通过 Automation 360 IQ Bot 中创建的学习示例处理的文档。 这包括在 Automation 360 IQ Bot 内部学习实例和连接到 Document Automation 的学习实例中处理的文档。
  • 在许可证页面中,文档 AI 许可证称为 Google Document AI(文档数量)
  • Control Room 还会跟踪自带许可证的用户在 Google Document AI 中处理的文档。 以前,Control Room 只为通过 Automation Anywhere 购买许可证的用户跟踪此类文档。
现在可以使用 Document Automation 的本地部署和Linux 安装配置 Oracle 数据库
导入在先前版本的 Document Automation 中创建的学习实例时,默认情况下不再选中将验证反馈发送到系统的复选框。 必须编辑学习实例才能选中该复选框。
修复
内部版本 16694: 此内部版本包含以下修复程序(包括之前内部版本的修复程序):
拥有 Document AutomationStandard Forms 许可证或 Standard Forms(适用于 IQ Bot)许可证的用户现在可以在 Document Automation 中创建 Standard Forms 模型。
内部版本 16685: 此内部版本包含以下修复程序:
Bot Agent 现在会在运行 Document Extraction packageactions 后清空资源文件夹。
导入在先前版本的 Document Automation 中创建的学习实例时,默认情况下不再选中使用验证提高准确性复选框。
Document Automation 现在可以正确跟踪所有 On-Premises 安装中的许可证使用情况,无论端口号如何。
现在可以为具有用户定义文档类型的学习实例添加公式验证。
Document Automation 中的标准表单在全新安装或升级的多租户 Control Room 上受支持。 以前,Document Automation 中的标准表单仅在全新安装的多租户 Control Room 上受支持。
刷新验证器页面时,验证器会显示您上次处理的文档。 之前在刷新页面后,验证器有时会显示您已验证的第一个文档。
使用代理配置的 Bot Runner 设备可以成功运行 Document Extraction package 中的 actions

Service Cloud 工单 ID: 01856276, 01862174, 01911425

限制

标准表单仅支持从任何文档中提取唯一字段。 如果在多个页面上有相同名称的字段,必须在模型创建工具中使用不同的标签名称对文档进行训练。

例如,如果两个不同的页面上都有名为 date 的字段,则必须使用 date1date2 作为模型创建工具的唯一标签名称进行训练。

为标准表单 v3.0 创建模型时,模型名称中不能使用空格。 如果模型名称包含任何空格,则会生成 InvalidParameter 错误消息。

标准表单 v3.0 无法从 Azure AI Document Intelligence 服务获取平均准确率数据。 因此,标准表单训练显示 v.3.0 服务的平均准确率为 0.00%。

在获取标准表单模型时,如果在 Document Automation 中没有可用的配置,则会显示错误的错误消息。

模型列表表格的调整大小功能无法正常工作。 因此,您无法在标准表单中调整表头或列的大小。

在创建具有多页的 v.3.0 模型时,运行分析结果不会以标准表单显示。

表名的默认字符限制为 100 个字符,表字段名的字符限制为 155 个字符。 但是,如果您要重新配置表格,可以添加超过默认限制的字符。

复选框或单选按钮的系统识别区域 (SIR) 未针对标准表单 v.3.0 模型生成。

标准表单目前在 Linux 上不受支持。

Validator 中对系统识别区域 (SIR) 进行任何重新映射或重新绘制都会导致检测到错误的复选框。 但是,在更改自动生成的映射后,您可以将复选框的值输入为选中未选中

当将学习实例从一个 Control Room 迁移到另一个时,必须由同一用户导出和导入 .dw 文件。
如果学习实例从多行字段中提取数据并将其传输到 CSV 文件中,则每行的末尾会添加一个额外的空格。
当您将鼠标悬停在“平均验证时间”和“按文档数量划分的验证器性能”小部件中的数据点上时,正确的值不会立即显示在弹出窗口中。
如果您在创建自定义表字段时没有提供字段名称和字段标签,即使您未选择该字段,Document Automation 也会阻止您创建学习实例。
如果您单击测试正则表达式并替换正则表达式字段中的值,该字段现在限制为 50 个字符。

解决方法: 单击取消以退出测试正则表达式窗口,并在正则表达式字段中进行修改。

在标准表单 v3.0 模型的表单 OCR 测试工具 (FOTT) 上未生成表格图标。

如果字段名称包含超过 100 个字符,则不会出现滚动条,您将无法看到表单字段的值。

如果表名包含超过 50 个字符,则无法扩展表的大小。 此外,当您将鼠标悬停在表格上时,字段名称不会显示。

如果在配置自定义逻辑时测试无效的 Python 脚本,系统会返回包含 Python 执行路径的错误消息。
有时文档提取会失败,并且在 Automation Co-Pilot 请求状态中会出现以下错误消息之一: 提取机器人失败。 请检查活动/审核日志以获取更多详细信息下载机器人失败。 请检查活动/审计日志以获取审计日志中此消息的更多详细信息此用户会话的现有部署正在进行中

如果发生这种情况,请在受改变的设备上重启 Bot Agent

如果安装了 Control Room On-Premises,文档工作区仪表板有时会显示不正确的页面使用指标。
如果您的代理配置了代理自动配置 (PAC) 文件,则无法使用 Google Vision OCR 处理文档。
当您创建或编辑学习实例时,如果字段名称以数字值开头,则该字段的公式验证将失败。 此问题适用于表单字段和表字段。
如果在禁用验证反馈选项的情况下导入学习实例,则验证反馈选项将变为启用状态,您必须手动编辑学习实例才能禁用该选项。
对于 Standard Forms,当处理多页文档并进入验证时,即使 Validator 中的系统识别区域 (SIR) 是正确的,Validator 中也会有一页被重复。

IQ Bot

更改内容
如果您使用的是不支持 TLS 1.2 的较旧版本 Microsoft SQL Server,则必须保留 IQ Bot 数据库备份并更新到支持 TLS 1.2 的 Microsoft SQL Server 版本。
IQ Bot 现在使用最新版本的 Python (3.11.0) 进行自定义逻辑验证。 要使用最新版本,您必须从 cx_Oracle 8.3 升级到 python-oracledb。 请参阅 从 cx_Oracle 8.3 升级到 python-oracledb
修复
IQ Bot 现在可对包含单引号的 Python 自定义逻辑字段执行后处理,例如 print('Test')

IQ Bot 中,当文档被损坏、删除或无法在 ValidatorDesigner 中加载时,将显示占位符图像。 应用程序在您上传新文档之前将不会保持一致。

Service Cloud 工单 ID: 00792976, 00835371

在实际正式部署过程中,您不得将学习实例或机器人从测试环境移动到实际正式环境,反之亦然。

Service Cloud 工单 ID: 01808931, 00821541, 01253373, 00836954, 01271722

当您在手动或自定义组中上传任何无效文档时,该文档将被处理。 然而,对于不支持的页面,将不会生成系统识别区域 (SIR)。

以前,当一个无效文档与一个有效文档一起上传并进行提取处理时,查看提取页面会一直加载。

Service Cloud 工单 ID: 01786098

在 Healthcheck API 中,输出显示了正确的分支名称约定,例如: RC-A360.27。 以前,当分支名称约定为 heads/RC-A360.27 时,会显示不正确的运行状况信息。

如果在文档验证过程中遇到错误或异常,则会处理该错误或异常,并且文件在输出中一致显示。

Service Cloud 工单 ID: 00827940

IQ Bot 中,如果 RabbitMQ v3.8.17 和 v3.8.18 无法正常运行,则现在可以通过更新系统环境变量 RABBITMQ_LOG_BASE 来更改日志目录位置。 如果手动提供此变量并指定所需的目录位置,则日志将在新位置创建和更新。 之前,在 rabbitmq.conf 文件中为 log.dir 变量提供的配置不支持 RabbitMQ v3.8.17 和 v3.8.18。

Service Cloud 工单 ID: 01844995

启用 PDFBox 时,现在会为手动分组生成系统识别区域 (SIR)。 以前,当启用 PDFBox 时,在创建学习实例期间,某些矢量 PDF 的 SIR 未为手动组生成。

Service Cloud 工单 ID: 01844223, 01849638

当同一个学习实例的设计器在另一个窗口中打开时,您无法导入 IQ Bot 存档 (IQBA) 文件。 之前,导入失败是因为 visiobotDetails 表中的 LockedTimestamp 字段在 IQBA 导出时有一个值。 这导致了一个错误,因为 LockedTimestamp 字段期望一个空值。

Service Cloud 工单 ID: 01818474

限制
IQ Bot 的快速安装升级过程中,安装步骤中显示了错误信息。 您必须单击确定才能继续。
在导入和导出 IQ Bot 存档 (IQBA) 文件时,最大上传文件大小限制设置为 5 GB。 如果文件大小大于 5 GB,则必须删除不需要的组以减小文件大小并成功迁移。

如果 IQ Bot 存档 (IQBA) 文件大小超过 2,147,483,647 位,则文件存储不会将导出的文件从输出文件夹上传到所需位置。

有时,PDFBox 无法准确检测到 PDF(便携式文档格式)文档。 我们建议您在将文档上传到 IQ Bot 之前,使用 Adobe Acrobat 将其转换为 PDF。

界面更新

IQ BotDocument Automation
“创建学习实例”窗口现在包含一个下拉菜单,用于选择 OCR 提供程序。
下拉菜单选择 OCR
使用 Google Vision OCR 提取数据