閱讀及檢閱 Automation Anywhere 文件

Automation 360

關閉內容

內容

開啟內容

使用擷取文字action

  • 已更新:2022/06/28
    • Automation 360 v.x
    • 組建
    • RPA 工作區

使用擷取文字action

從 PDF 檔案中擷取文字,然後使用 [擷取文字] action將其儲存為文字檔案。

重要: 如果 PDF 檔案中未內嵌正確字型,[擷取文字] action便無法正確擷取文字。

程序

若要從 PDF 檔案擷取文字,請執行下列步驟:

  1. Actions選擇區中,按兩下 [擷取文字] action,或從 PDF package拖曳此動作。
  2. PDF 路徑中,選擇以下選項之一來指定 PDF 的位置:
    • Control Room 檔案: 使您可以選擇位於文件夾中的 PDF 文件 Control Room.
    • 桌面設定檔: 使您能夠選擇設備上可用的 PDF 文件。
    • 變數: 使您能夠指定包含 PDF 文件位置的文件變量。
  3. 選擇性的: 用戶密碼所有者密碼 字段中,輸入密碼以限制對加密 PDF 文件的訪問。
    • 用戶密碼:允許用戶對加密的 PDF 文件執行特定操作。
    • 車主密碼:允許用戶使用密碼打開文件。
  4. 在 [文字類型] 欄位中,選取下列其中一個選項:
    • 純文字:擷取文字並將其複製到文字檔案。

      此作業類似於從 PDF 檔案複製及貼上文字到文字檔案。

    • 結構化文字:保留從 PDF 檔案中擷取之文字的原始格式。
      您可以選取 [減少資料遺失] 選項,確保以最少的字元重疊來擷取完整文字。使用此功能時,會減少字元與其他字元重疊的數量。
      註: 當您選取此選項以擷取文字時,擷取的文字可能會包含額外的空格字元。
  5. 頁面範圍 字段中,選擇以下選項之一:
    • 所有頁面:使您能夠將 PDF 文件中的所有頁面保存為圖像。
    • 頁數:允許您輸入要保存為圖像的頁面的頁碼。
  6. 在 [匯出資料至文字檔案] 欄位中,指定文字檔案的名稱和位置。
    註: 您必須在文字檔案的名稱中包含 .txt 副檔名。例如,如果檔案名稱是 June_Quarter_report,.txt 副檔名即為 June_Quarter_report.txt
  7. 選中 覆蓋同名文件 複選框以覆蓋現有同名文件。
    註: 如果未選擇此選項並且 bot 在指定位置遇到同名文件時, bot 將失敗。
  8. 選擇性的: 將 PDF 屬性分配給字典變量 列表中,選擇一個字典變量來保存文件屬性。
    如需詳細資訊,請參閱為 PDF 屬性使用字典變量
  9. 按一下 [儲存]
傳送意見反饋