Document Automation v.38 版本发布

查看 Document Automation v.38 版本中的新增内容、修复内容及限制。

新增内容

自适应搜索查询

自动适应数千种格式的布局变化,并在运行时动态应用正确的查询。 用户能够在单个学习实例中针对具有相似布局的文档测试和定义特定搜索查询,从而提升不同文档格式的数据提取准确性。

自适应搜索查询 功能提供以下优势:
  • 在集群级别对搜索查询进行测试和验证。
  • 在单个学习实例内,为同一字段在多个集群中定义不同的搜索查询。
  • 将经过验证的集群特定查询提升到实际正式环境,以实现稳健且一致的数据提取性能。
  • 减少手动查询调整,并在单一、统一的学习实例中提升对各种文档格式的提取准确性。

自适应搜索查询

Azure AI Document Intelligence标准表单 中支持 4.0 版本(Service Cloud 工单 ID: 02166473)

现在可以在 Document Automation 中使用 Azure AI Document Intelligence 版本 4.0 创建自定义模型。 新功能包括改进的自定义模型、更高的数据提取准确性和签名检测。

Control Room 中包含以下功能:

  • 模型页面现在显示用于创建每个 Azure AI Document Intelligence 模型的版本号。
  • 引入了签名检测支持,可识别文档中的手写签名和数字签名。 这可提高需要签名验证的工作流中的自动化准确性。

为标准表单创建学习实例 | Document Automation 中的验证规则

Automation Anywhere用户定义的提供程序支持新语言

现在,使用 Automation Anywhere(用户定义)提供程序和 ABBY OCR 或 Google Vision OCR 提供程序时,可以为用户定义文档类型处理以下语言的文档:

  • 捷克语
  • 丹麦语
  • 芬兰语
  • 挪威语
  • 斯洛伐克语
  • 瑞典语

Document Automation 中支持的语言

修复

当用户被分配了 Conversational Automation Co-Pilot User 许可证后,用户现在可以在 Document Automation 的公共学习实例中处理文档。
Automation Co-Pilot 验证器中的自动填充选项现在能够按照预期工作。

此前,在特定场景下,此选项无法按预期工作。

您现在可以无差错地上传和处理学习实例的文档。

此前在特定场景下会显示错误。

Service Cloud 工单 ID: 02135184, 02135889, 02154359

现在您可以随后处理相同的文档而不会出现错误。

此前,在某些场景下,在验证器中会显示错误。

Service Cloud 工单 ID: 02187660

现在可以创建 标准表单 模型,而不会遇到任何性能问题。

此前,在特定场景下用户会遇到性能问题。

Service Cloud 工单 ID: 02219164

在使用 标准表单 Neural 模型训练文档后,运行分析选项将从测试文档中提取相关信息。

此前在某些字段未能提取数据。

Service Cloud 工单 ID: 02185363, 02185363

测试模式下版本历史记录中的验证反馈字段仅显示用户验证过的字段。

以前,在验证反馈字段中会显示使用 生成式 AI 提取的字段。

当启用学习实例的测试模式并禁用验证反馈时,现在会在测试模式下处理的文档中正确显示集群 ID。

以前,在这种场景下,已处理文档显示的集群 ID 存在错误。

限制

当您在学习实例和处理文档的字段及文档规则中添加无效的正则表达式模式时,数据提取将会失败。

解决方法: 在将正则表达式模式添加到字段之前进行验证,并记录规则,然后处理文档。

Cloud-沙盒中使用 自适应搜索查询 功能时,如果为某字段添加自定义查询,使用该自定义查询处理文档后,再打开搜索查询选项以查看自定义查询,将会显示错误。
当您有待验证的文档并更新至 v.38 版本后,在验证队列中的第一个文档并单击提交按钮后,会显示错误。

解决方法: 执行以下一项解决方法:

在现有项目中创建新模型时,若先添加新字段再进行 标准表单 模型训练,可能会遇到错误。

解决方法: 在创建新项目之前,请重新加载项目页面。 如果您在未刷新页面的情况下创建项目页面并发生错误,请在重新加载项目页面后创建新项目并重启训练。 现有的学习实例、项目和模型都不会受到影响。

先前版本中的限制
创建自定义表时,您将无法使用日语、韩语或中文的自定义表名。
从版本历史记录中将学习实例还原到任何以前的版本并重新处理文档时,文档上传计数会增加。
在测试模式下处理文件名大于或等于 75 个字符的文档时,可能无法缩短此类文档的重新处理时间。
如果您在管理员设置中禁用了 OCR 提供程序,并且您的 Control Room 使用的是英语以外的其他语言,那么在以下情况下以英语启用 OCR 提供程序设置时,将会出现错误:
  • 当您创建使用 OCR 提供商的学习实例时
  • 当您更改现有学习实例的 OCR 提供程序时
当您使用 文档提取 软件包机器人 中的 文档分类器 操作(分类、分类文档和训练分类器)和提取数据 操作 时,机器人 将无法执行。

解决方法: 确保在使用 文档分类器 软件包 的任何操作 以及 文档提取 软件包 的提取数据 操作 时创建单独的 机器人。 如果您需要按顺序执行这些 机器人,请将这些 机器人 包含在 Automation Co-Pilot 流程中。

如果您复制使用 Document Automation 中配置的第三方解析器的学习实例,并使用复制的学习实例处理文档,数据提取将会失败。
当用户在自定义流程学习实例上处理文档时,验证文档计数在提取后不会更新。 此外,如果用户提交文档,验证文档计数将更新为负值。
具有 Automation Co-Pilot 管理员权限的用户无法查看分配或请求的 Document Automation 任务,这些任务处于待处理或已完成状态。
当您使用 IQ Bot Pre-processor 软件包 操作 时,如果输出文件夹路径包含日文字符,处理文档时会出现错误。

解决方法: 在不包含任何日语字符的文件夹路径中创建一个输出文件夹,并将该路径提供在输出文件夹路径字段。

界面更新

Document Automation
使用 自适应搜索查询 功能,可在单个学习实例中针对具有相似布局的文档测试和定义特定搜索查询,从而提升不同文档格式的数据提取准确性:

自适应搜索查询选项

自适应搜索查询