閱讀及檢閱 Automation Anywhere 文件

Automation 360

關閉內容

內容

開啟內容

選取 OCR 引擎

  • 已更新:2021/09/09
    • Automation 360 v.x
    • 探索
    • RPA 工作區

選取 OCR 引擎

您可以從 UI 中選取不同 OCR 引擎,以根據您的文件類型查看最適合資料擷取需求的引擎。實作引擎變更時不需要停止和重新啟動 IQ Bot 服務。

IQ Bot 安裝期間,系統會將 Tesseract Optical Character Reader 的最新版本設定為預設 OCR 引擎。這也是產品的全域設定。

然而,您可以在 Settings.txt 檔中手動設定 OCR 引擎,使其成為預設引擎。與 IQ Bot 的先前版本類似,您可以繼續使用要設定為預設值的 OCR 引擎名稱手動更新 Settings.txt 檔。

如果透過 settings.txt 檔案組態選擇 OCR 引擎的過時版本或不支援的引擎,系統將顯示錯誤訊息。

建立學習實例時,您可以從 UI 直接提供的下拉式清單中選取 OCR 引擎。
註: 在介面中選擇 OCR 引擎將覆寫 settings.txt 檔中的設定。

建立學習實例

程序

  1. [建立新學習實例] 頁面上,選取文件的領域和語言。
    [我的學習實例] 清單頁面中會提供新的 [OCR 引擎] 欄,其中顯示用來建立每個學習實例的 OCR 引擎。在決定處理文件相關事宜時,此資訊對於使用者很有幫助。
  2. 選擇領域時,即會顯示 [要擷取的欄位][進階設定] 區段。
    每個領域都有預先定義的主要支援語言清單。根據特定領域的支援語言,可以從 [文件的主要語言] 下拉式清單中啟用和使用語言選擇。
    註: 如果您從 [文件的主要語言] 下拉式清單中選取語言,然後選取不支援該語言的引擎,系統將在 [光學字元辨識] 下拉式清單中顯示錯誤訊息。
  3. 按一下 [進階設定] > [光學字元辨識] 以顯示 OCR 引擎選項下拉式清單。

    如果 OCR 引擎選項無效,則不會啟用 [建立實例並分析] 選項。

    註: 在安裝過程中,IQ Bot 會自動安裝除 ABBYY FineReader Engine 之外的所有 OCR 引擎。
    重要: 您只能在 Automation 360 IQ Bot On-Premises 設定所選的 OCR 引擎。您無法編輯 Automation 360 IQ Bot Cloud 中的 OCR 設定,因為除了 ABBYY FineReader Engine 之外,這些設定均無法存取。您可以使用 appConfigurations REST API 編輯 ABBYY FineReader Engine 的組態設定。

    您可從以下選項中選擇:

    選項說明
    Tesseract OCR4 這是預設引擎,除非已在 settings.txt 檔中變更。
    ABBYY FineReader Engine

    若要驗證 ABBYY FineReader Engine 是否已安裝在電腦上且可供使用,請檢查 settings.txt 檔、SDK 檔的 OCR 外掛程式資料夾和 [光學字元辨識] 下拉式清單。

    註:IQ Bot [Local Device] packageIQ Bot Extraction package 中也提供支援。

    在 IQ Bot 中使用 ABBYY FineReader Engine OCR 引擎

    Microsoft Azure Computer Vision OCR engine IQ Bot 支援此 OCR 引擎支援的所有語言。

    使用Microsoft Azure Computer Vision OCR engine

    Google Vision API IQ Bot 支援 Google Vision API 作為 OCR 引擎,並支援此引擎支援的所有語言。

    使用 Google Vision API OCR 引擎

    Tegaki API IQ Bot 支援其 OCR 引擎擷取日文和韓文文件的特定資料。您需要下載並使用您的私人授權才能使用 Tegaki API
    註: Automation 360 IQ Bot Cloud 不支援 Tegaki API OCR 引擎。

    使用 Tegaki API OCR 引擎

    我的 PDF 文件沒有影像

    無論您指定或選擇哪個 OCR 引擎,在預設情況下,所有上傳的 PDF 文件都會使用 PDFBox OCR 進行處理。

    如果要上傳包含影像的非 PDF 文件或 PDF 文件,請清除 [我的 PDF 文件沒有影像] 核取方塊,以確保使用您指定或選擇的 OCR 引擎處理文件。

    [我的 PDF 文件沒有影像] 核取方塊預設為啟用。若要停用此功能,請參閱 停用 PDFBox 選項
    提示: 如果 IQ Bot 無法從低品質或手寫文件中擷取資料,請針對該問題進行疑難排解:

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

傳送意見反饋