使用 Google Document AI 的提取 action

配置提取 action,以使您的bot 能够将文档发送到 Google Document AI 进行数据提取,并检索 JSON 格式的输出。

先决条件

登录到您的 Google Cloud 账户,然后转到处理器页面检索您的自定义端点。 请参阅 使用您的处理器端点

您的自定义端点应遵循以下格式:https://LOCATION-documentai.googleapis.com/API_VERSION/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID 。 您将需要使用加粗的参数来配置此 action

过程

  1. 双击或拖动Google Document AI > 提取 action
  2. 文档文件路径字段中,提供要处理文档的文件路径。
    注: 如果在一个循环 action中使用此 action 处理文件夹中的所有文档,请确保在保存文件名的变量和保存扩展名的变量之间加一个句点。 例如,C:\Documents\$dictFile(name)$.$dictFile(extension)$
  3. 请提供以下信息,这些信息可参见您的自定义端点。
    • 项目 ID
    • 处理器 ID
    • 位置
  4. 会话名称字段中,输入在连接 action 中用于连接到 Google 服务账户的会话名称。
  5. 可选: 选择或创建一个字符串变量来保存输出。
    action 以 JSON 格式返回数据。
  6. 单击保存

后续步骤

您可以使用 JSON package 中的 actions 解析数据并从特定节点提取值。 要了解如何执行此操作,请参阅以下步骤:
  1. 使用开始会话 action 启动 JSON 会话。 在 JSON 文本字段中,插入保存提取 action输出的字符串变量。
  2. 使用获取节点值 action解析Google Document AI > 提取 action 的输出,并将节点值分配给一个列表变量。

    您可以在 获取节点值 action 后插入一个 循环 action,以遍历每个列表项并对每个节点值执行操作。

  3. 使用结束会话 action 终止 JSON 会话。