文档自动化 中的 标准表单 数据流

以下数据流程图显示了如何在 文档自动化 中使用各种组件配置 标准表单,以促进数据在 文档自动化 和第三方提取服务之间的流动。


Document Automation 与标准表单之间的数据流
  • 标注和模型创建工具

    您使用模型创建工具来标注和创建模型。 在此图中,训练文档上传到工具中,并存储在第三方服务的 Blob 存储中。 为了获得最佳结果,我们建议您上传并标注至少五个训练文档以创建模型。

  • Blob 存储

    Blob 存储是一个存储单元,其中包含训练文档及其相关信息。

  • 提取模型

    通过 API 从第三方服务的 Blob 存储中获取训练好的模型。 模型 ID 可以是 GUI ID 或标准名称,用于创建学习实例。

  • 学习实例创建

    您可以浏览并选择模型来创建学习实例。 选择模型后,可以上传文档到此学习实例中进行提取。 学习实例访问第三方提取服务以检索提取结果。 结果移动到输出文件夹,或者文档移动到验证器。

  • 提取引擎

    提取引擎根据模型 ID 执行提取,并将结果返回到学习实例。

  • 输出结果
    提取完成后,输出结果将包括三个部分:
    • extraction .csv
    • auto detected table .csv
    • response.json