使用 生成式 AI 为半结构化文档创建学习实例
- Updated: 2025/05/06
用本主题作为指南,创建一个学习实例,利用 生成式 AI(生成式人工智能)功能从半结构化文档中提取数据,例如发票、用户定义的订单和采购订单或供应链文档,如: 到货通知、提单、装箱单和运单。
对于从半结构化文档中提取数据,用户可以选择使用 生成式 AI 功能,此外还可以通过在创建学习实例时勾选使用验证提高准确性选项来利用开箱即用的用户验证反馈功能。 这确保了数据提取的一致性和改进,并具有开箱即用的准确性。 让我们带您了解创建具有 生成式 AI 功能的学习实例的步骤,该功能将实现从半结构化文档中准确提取数据。
先决条件
- 对于供应链文件,生成式人工智能驱动的数据提取功能默认启用,且无法禁用。 因此,您必须启用 生成式 AI 和其他到 文档自动化 的外部连接,以便无错误地处理文档。 请参阅 启用 生成式 AI 以及与 文档自动化 的其他外部连接。
-
公司的一名专业开发人员将执行以下任务:
- 创建、编辑和删除学习实例
- 将文档上传以进行处理和测试
- 将学习实例从私有文件夹签入和签出到公共文件夹
-
许可证要求:需要 机器人创造程序 许可证来执行上述任务。
-
分配的角色和权限:
- AAE_IQBot 服务 或 AAE_IQBot 管理员
- AAE_Basic
过程
后续步骤
- 将学习实例发布到公共存储库,以便学习实例可以在公共模式下用于从真实文档中提取数据,并且验证者可以手动验证文档。 请参阅 实际正式发布学习实例。
- 在 列表页面中,找到您刚刚创建并发布的学习实例,然后单击 处理以开始上传文档进行处理和数据提取。 请参阅 在 文档自动化 中处理文档。
- 打开包含提取数据的 CSV 文档,与处理后的文档进行比较,以验证和确认 GenAI 启用的搜索查询字段中的提取数据是否高度准确。