阅读和查看 Automation Anywhere 文档

Automation Anywhere Automation 360

关闭内容

内容

打开内容

使用提取文本 action

  • 已更新:11/17/2020
    • Automation 360 v.x
    • 版本
    • RPA 工作区

使用提取文本 action

使用提取文本 action 可从 PDF 文件中提取文本,并将其保存在文件中。

过程

要从 PDF 文件中提取文本,请执行以下操作:

  1. Actions 面板中,从 PDF package 双击或拖动提取文本 action
  2. PDF 路径中,选择以下选项之一来指定 PDF 的位置:
    • Control Room 文件:用于选择 Control Room 内文件夹中可用的 PDF 文件。
    • 桌面配置文件:用于选择设备上可用的 PDF 文件。
    • 变量:用于指定包含 PDF 文件位置的文件变量。
  3. 可选: 用户密码所有者密码字段中,输入密码以限制对加密 PDF 文件的访问。
    • 用户密码:允许用户对加密的 PDF 文件执行特定操作。
    • 所有者密码:允许用户使用密码打开文件。
  4. 文本类型字段中,选择以下选项之一:
    • 纯文本:用于提取文本并将其复制到文本文件中。

      它类似于将文本从 PDF 文件复制并粘贴到文本文件。

    • 结构化文本:用于保留从 PDF 文件中提取的文本的原始格式。
  5. 页面范围字段中,选择以下选项之一:
    • 所有页面:用于将 PDF 文件中的所有页面另存为图像。
    • 页面:用于输入要另存为图像的页面的页码。
  6. 将数据导出为文本文件字段中指定文本文件的名称和位置。
    注: 您必须在文本文件的名称中包含 .txt 扩展名。例如,如果文件名为 June_Quarter_report,则 .txt 扩展名为 June_Quarter_report.txt
  7. 选择覆盖具有相同名称的文件复选框以覆盖现有的同名文件。
    注: 如果未选择此选项,并且 bot 在指定位置遇到同名的文件,bot 将会失败。
  8. 可选: 为字典变量分配 PDF 属性列表中,选择字典变量以保存文件属性。
    有关详细信息,请参阅将字典变量用于 PDF 属性
  9. 单击保存
发送反馈