閱讀及檢閱 Automation Anywhere 文件

Automation 360

關閉內容

內容

開啟內容

使用 OCR 可信度改善輸出品質

  • 已更新:2022/06/30
    • Automation 360 v.x
    • IQ Bot
    • Digitize

使用 OCR 可信度改善輸出品質

將系統識別區域 (SIR) 和光學字元辨識 (OCR) 可信度與預先定義的門檻進行比較,以改善 IQ Bot 平台的輸出品質。

憑藉可信度的驗證對於文字類型欄位以及日期或數字欄位很實用,因為此驗證方式有助於傳送具爭議值的文件供人工檢視,即便欄位符合設定的驗證條件。

啟用憑藉 OCR 可信度的驗證

註: 此選項僅適用於您在建立學習實例時選擇 Tesseract OCR 的情況。

預設情況下將停用此功能。若要啟用此功能,請開啟 <IQ Bot Installation Folder>\Configurations\ 中所提供的 Settings.txt 組態檔,並在 ConfidenceThreshold 屬性中設定所需的門檻值。在此範例中,將字元等級的可信度門檻值設為 99,即 ConfidenceThreshold=99。若停用此功能,預設值將設為 0,表示此功能已停用。

註: 可信度門檻值一概適用於所有學習實例。

憑藉 OCR 可信度的驗證運作方式

如果文件中某個欄位的 SIR 字元等級可信度低於設定的可信度門檻值,該欄位的驗證便會失敗,從而導致該文件驗證失敗。

註: 若是由於 OCR 可信度驗證失敗以外的驗證規則 (例如,無效的數字格式) 導致欄位的值失敗,您將看到相應的工具提示而非可信度不足工具提示。

在訓練文件時,如果某欄位經查並無其他驗證錯誤,則預覽期間憑藉可信度對該欄位進行的驗證失敗將以橘色方塊顯示。其他驗證錯誤優先於 OCR 字元等級可信度驗證。

Troubleshoot: 如果 OCR 引擎無法識別中文 PDF 文件的 SIR,請針對該問題進行疑難排解:
傳送意見反饋