閱讀及檢閱 Automation Anywhere 文件

Automation 360

關閉內容

內容

開啟內容

數據提取 Document Automation

  • 已更新:2022/09/15
    • Automation 360 v.x
    • Digitize
    • Document Automation

數據提取 Document Automation

了解系統如何通過用戶提供的更改來提高提取精度 Validator.

通過驗證提高提取準確性

創建學習實例時,用戶可以選擇啟用此功能,以根據用戶提供的更改向學習實例發送反饋。 Validator.在 Document Automation,在生產模式下運行的學習實例可以在用戶調整或重新定位提取區域的大小時不斷“學習” Validator.
註: 此功能僅適用於 Automation Anywhere 預訓練模型。

下圖提供了學習實例不斷接收來自驗證的反饋的過程的可視化概覽:

通過驗證反饋“教授”學習實例的過程

  1. 上傳的文檔通過提取引擎。
  2. 如果學習實例成功提取數據,則將文檔添加到直通處理 (STP) 計數中,並將提取的值下載到 Success 文件夾中的文件中。

    如果學習實例無法提取數據,則係統評估文檔是否包含不熟悉的佈局。

  3. 如果學習實例不識別文檔佈局(新佈局),則發送文檔進行手動驗證,用戶“教”學習實例如何通過設置提取區域來提取數據。
  4. 提取的值會下載到 Success 文件夾中的文件中,並且更改會收集到反饋文件中,然後發送到反饋數據庫。
    註:
    • 僅當用戶更改提取區域時才會收集反饋。如果用戶手動輸入文本,系統不會收集反饋。
    • 反饋文件僅包含字段位置的數據,以提高後續文檔的提取準確性。

    如果學習實例識別出集群,它會從反饋數據庫中檢索先前的反饋並使用它來提取數據。

如何 Document Automation 識別新佈局

Document Automation 提取基於對象檢測。在文檔處理期間,提取引擎識別對像或字段和關聯值的鍵值對。引擎創建文檔的“指紋”,其中存儲對象的順序和每個對像在文檔中的位置。

處理文檔時,如果引擎識別出密鑰及其位置,則會根據現有指紋對文檔進行分類和提取。否則,引擎會保存密鑰及其位置的新指紋。

引擎識別文檔中現有指紋或創建新指紋的過程

傳送意見反饋