閱讀及檢閱 Automation Anywhere 文件

Automation 360

關閉內容

內容

開啟內容

在 Document Automation 中建立學習實例

  • 已更新:2022/09/22
    • Automation 360 v.x
    • Digitize
    • Document Automation

Document Automation 中建立學習實例

通過創建學習實例來開始處理文檔,以從發票、水電費 或收據中提取數據。學習實例是一種結構,可保存例如文件類型、語言和想要擷取的欄位等資訊。

先決條件

  • 要創建學習實例,您必須是 學習實例創建者 用戶。請參閱Document Automation 位使用者
  • 創建一個使用 Google Document AI 模型,您必須創建一個憑證和儲物櫃來保存您的安全令牌。請參閱建立認證建立 locker
    註: 配置時 locker,您必須將 aari-document-processor 自定義角色添加為 locker 消費者。
  • 創建一個使用 Google Document AI 型號,必須購買 Google Document AI 許可證。請聯繫您的客戶支持經理 (CSM) 以獲取許可證。

觀看此視頻,了解創建學習實例的完整端到端過程:

程序

  1. 來自 Control Room 主頁,導航到 管理 > 學習實例 > 創建學習實例
  2. 輸入學習實例的名稱和描述。
    Document Automation 不允許重複的學習實例名稱,因此您提供的名稱必須是唯一的。
  3. 選擇文檔類型:發票,用戶自定義,公用事業賬單收據
    使用用戶定義的文檔類型來處理視覺上類似於發票的文檔,例如包含鍵值對和表結構的採購訂單和銷售訂單。在此文檔類型中,您可以創建和配置所有表單和表格字段。
  4. 選擇語言。
    Document Automation 支持英語、荷蘭語、法語、德語、 意大利語、葡萄牙語(巴西) 和西班牙語。
    註: 法語、德語和西班牙語文檔的提取目前處於預覽階段。提取結果將在未來版本中改進。
  5. 如果您選擇發票:選擇提供商。
    如果您在步驟 4 中選擇了英語, Automation Anywhere (預訓練) 是自動選擇的。
  6. 對於學習實例 Automation Anywhere (預訓練) 提供者,您可以選擇向系統發送反饋以改進提取結果。如需詳細資訊,請參閱數據提取 Document Automation
  7. 按一下 [下一步]。

我們建議您將示例文檔與 Control Room 配置表單和表格字段時的窗口。

註:
  • 表單域是一種在文檔中只出現一次的域。
  • 表格字段是在整個文檔中重複出現的一種字段,通常以表格的形式出現。

  1. 配置用於提取的表單和表格字段。
    Document Automation 提供一組標準的表單和表格字段,其中許多最初是不可見的。您可以按字段名稱、字段標籤或數據類型搜索字段。
    要查看完整的字段列表,請單擊 顯示未使用的字段。請參閱以下視頻進行演示:
    單擊字段以打開字段編輯器。您可以編輯字段的大多數屬性。您無法編輯名稱和默認別名。Document Automation 將默認別名(硬編碼關鍵字)分配給標準字段以幫助提取。您不能修改或刪除默認別名,但可以在 自定義別名 字段中添加別名。有關創建自定義別名的演示,請參見以下視頻:
    將鼠標懸停在字段右側的菜單圖標上可訪問向上/向下箭頭。使用箭頭重新排列字段的順序,以實現更有效的手動驗證。欄位的順序不會影響擷取。
    要了解有關其他字段屬性的更多信息,請查看下一步中的表格。
  2. 若要新增欄位,請按一下 [新增欄位] 並填寫以下欄位:
    選項說明
    欄位名稱 輸入以字母字元 (A-Z 或 a-z) 開頭的欄位名稱。

    在標準字段中,字段名稱是硬編碼的,不能更改。

    欄位標籤 輸入使用者易記的名稱以幫助驗證器。

    例如,您可以將組織稅號重新命名為本地化名稱,例如 VAT 號碼

    字段標籤不影響提取。

    信度 設定門檻以減少潛在的誤判。

    在處理時, Document Automation 引擎為文檔中的每個字段分配一個分數,以表明數據被正確提取的確定性。如果文件包含分數低於可信度門檻的欄位,則會將文件傳送至驗證佇列。

    如果您輸入高置信度閾值,則會將更多文檔發送到驗證隊列。如果您輸入低置信度閾值,則將更少的文檔發送到驗證隊列。

    支持從零到 100 的值。

    資料類型 地址* 中選擇,文本數字日期

    如果字段中的數據與數據類型不匹配,則將文檔發送到驗證隊列。

    Document Automation 支持日期格式的變化。

    * 如果您正在使用用戶定義的文檔類型配置學習實例,則表單字段包括地址數據類型,它提取地址的整個結構。

    必填 選取下列其中一個選項:
    • 必需:字段不能為空。
    • 選擇性:字段可以為空或文檔中不存在。
    預設別名 此欄位不需要執行任何動作。Document Automation 將默認別名(硬編碼關鍵字)分配給標準字段以幫助提取。
    自訂別名 額外的關鍵字來幫助 Document Automation 定位字段。例如,將 VAT 號碼等國家或地區特定欄位名稱新增為組織稅號自訂欄位的別名。
    註: 自定義別名必須是唯一的。他們不能複制另一個字段的默認別名。例外:表單字段可以有重複的自定義別名作為表字段,反之亦然。
    驗證規則 根據數據類型,使用模式、公式、列表和語句(例如開頭或結尾為)創建規則。

    [起始文字] 和 [結尾文字] | 模式 | 清單 | 公式

  3. 按一下 [建立]。
當創建一個新的學習實例時, Control Room自動化 中創建一個與學習實例同名的文件夾 文檔工作區 文件夾。該文件夾包含兩個 bots (提取和下載),一個過程,一個表格。學習實例資產的示例截圖
  • 過程:使用 IF/Else 情境管理流程,Document Automation 會透過這些情境從上傳的文件中擷取資料,將文件分配給使用者進行驗證,並下載擷取的資料。要了解更多信息,請參閱 有關 AARI 過程中 Document Automation
  • 提取機器人:從已上傳文檔中定義的字段中提取數據。
  • 下載機器人:將擷取的資料下載至裝置或共用網路上的特定資料夾。
  • 表格:定義發送到進程的輸入參數。輸入參數包括學習實例名稱、上傳的文件和輸出檔案路徑。

後續步驟

上傳文件至學習實例、修正驗證錯誤,並確認擷取的資料:在 Document Automation 中處理文件

傳送意見反饋