閱讀及檢閱 Automation Anywhere 文件

Automation 360

關閉內容

內容

開啟內容

使用火車分類器 action

  • 已更新:2022/01/10
    • Automation 360 v.x
    • 組建
    • IQ Bot

使用火車分類器 action

使用 火車分類器action 創建 Classifyaction 將文檔分類為輸入所需的類別。

先決條件

在建造之前 bot,收集示例文檔並將它們分類到文件夾中。確保示例文檔集滿足以下要求:

  • 至少有兩個類別。
  • 每個類別至少 15 頁(推薦 20 頁)。
  • 將具有多頁的輸入 PDF 文檔拆分為單頁 PDF 文檔。請參閱使用拆分文檔 action

    例如,如果您有一個包含三頁的 PDF 文檔,請將其拆分為三個單頁 PDF 文檔。

如果未滿足這些最低要求,則會在運行期間顯示錯誤消息 bot 運行。

每個文件夾都有一個文檔選擇,這些文檔是相關學習實例將處理的文檔樣本。火車 分類器action 將通讀文件夾中的文件,並根據存儲在每個文件夾中的文檔構建模型。
註: 作為 ABBYY FineReader EngineOCR 現在從版本 12.4 降級到版本 12.2,舊的 .icmf 文件不能用於重新訓練模型 Automation 360 v.24 的 IQ Bot Classifierpackage.如果您想將更多類別或更多文件添加到現有類別中,則必須創建一個新模型。

程序

  1. 在裡面 Actions 調色板,雙擊或拖動 訓練分類action 來自 IQ Bot 分類器package.
  2. 單擊 訓練 以繼續創建新模型文件。
  3. 選擇性的: 如果您有現有的模型文件,請單擊 重新訓練
    1. 使用 培訓文件夾路徑桌面文件夾 選項卡 中選擇現有文件夾路徑 。
      或者,單擊 變量 選項卡以手動輸入現有的訓練文件夾路徑。
    2. 使用 現有 zip 路徑 字段 從 控制室文件桌面文件 選項卡 中選擇.zip
      或者,單擊 變量 選項卡以手動輸入 .zip 文件夾的路徑。
      註: 訓練文檔時,會創建一個 .zip 文件夾,其中包含 .icmf.data.properties 文件。確保上傳整個 .zip 文件夾以重新訓練現有模型文件。
  4. 桌面文件夾變量選擇輸入文件夾路徑 。

    輸入文件夾路徑必須具有與要訓練分類器的文檔類別相對應的名稱的子目錄。例如,如果您有與銷售相關的文檔,則輸入文件夾路徑必須具有子文件夾,例如 InvoicePurchase Order

  5. 選擇性的: 如果您選擇 桌面文件,請單擊 瀏覽 更改默認文件路徑。
  6. 模型名稱 字段中輸入模型文件的 名稱。
  7. 使用 模型輸出路徑 字段選擇輸出模型文件的目錄。
  8. 選擇性的: 配置以下 高級設置
    1. 訓練優化:使用下拉菜單選擇訓練優化的類型。
      • 精度:如果您希望訓練模型精確但可能會遺漏少數文檔,請選擇此選項。
      • 召回:當您希望訓練模型在數據集中找到所有相關案例時,請選擇此選項。
      • F1 score:默認選擇和推薦設置,因為它結合了 PrecisionRecall

      默認選擇F1 分數精確度召回率

    2. 分類類型:使用下拉菜單選擇要包含的功能,例如文本、圖像或兩者兼有。

      默認選擇文本和圖像如果您選擇 TextText and image,支持的語言列表將顯示在 識別語言 下拉菜單中。

    3. OCR 設置提取所有文本塊從圖像中提取文本默認 啟用。

      在 默認啟用 OCR 設置OCR 在提取內容時。這確保了相對較低質量的文檔也可以根據來自的輸入進行處理 OCR.

  9. 單擊 保存運行
    模型輸出路徑 字段 中指定的目錄中創建為 .icmf 文件 。

後續步驟

創建模型後,構建一個 bot 對輸入文檔進行分類。請參閱使用分類 action

傳送意見反饋