使用提取字段 操作

使用提取字段操作从 PDF 中提取字段并将其分配给变量。

重要:
  • 当您从包含 20 个表单字段的 PDF 中提取字段时,处理时间可能比没有表单字段的 PDF 长 30% 到 40%。
  • 当您使用此 操作 从 PDF 文件中提取单选按钮时,如果未选择任何单选按钮,生成的值可能是 -1。 以前,当您未选择任何单选按钮时,输出为 0

过程

要从 PDF 文件中提取字段,请按照下列步骤操作:

  1. 操作 面板中,双击或拖动 提取字段 操作 PDF 软件包
  2. PDF 路径中,选择以下选项之一来指定 PDF 的位置:
    • Control Room 文件: 用于选择 Control Room 内文件夹中可用的 PDF 文件。
    • 桌面配置文件: 用于选择设备上可用的 PDF 文件。
    • 变量: 用于指定包含 PDF 文件位置的文件变量。
  3. 文件受保护字段中,如果文件已加密并提供用户密码所有者密码,请选择
  4. 单击打开 PDF 查看器
  5. 选择 PDF 文件窗口中,从 Control Room 文件或桌面文件中选择一个 PDF 文件。
  6. 可选: 输入密码。
  7. 单击加载,以打开 PDF 查看器
    PDF 查看器窗口中,打开 PDF,并用紫色虚线矩形突出显示所有结构化字段。
  8. 选择要提取的字段的矩形区域,然后单击添加字段,将字段及其值添加到提取字段表中。
  9. 可选: 您可以添加未在 PDF 中突出显示的非结构化字段。 选择 PDF 查看器上方提供的绘制区域选项,并在所需区域周围绘制一个矩形框。

    突出显示一个红色虚线矩形,并配有一个添加自定义区域选项

  10. 单击添加自定义区域,以在自定义区域窗口中查看捕获的坐标。 输入可用于输出变量的密钥名称
    注: 在使用绘制区域 > 添加自定义区域选项提取 PDF 文本时,请确保 PDF 数据按顺序排列并用标准字体编码,以便正确提取数据。 未编码的数据(例如,源自扫描文件和图像的数据)将不会被提取。
  11. 单击关闭,以在提取字段表中添加字段。
    提取字段的列表显示在 PDF 查看器窗口右侧面板的提取字段表格下方。
    提取的字段在 PDF 查看器中变为蓝色虚线矩形。 您可以通过选择字段周围的蓝色矩形来编辑提取的字段。
    使用提取字段表中提取字段旁边的垂直省略号按钮来编辑移动删除字段。
  12. 单击关闭,以关闭 PDF 查看器。
  13. 将输出保存到变量字段中,选择字典变量或多个变量以保存字段值。
  14. 单击保存