Automation 360

ラーニングインスタンスの作成

PDF としてダウンロード

コンテンツ

ラーニングインスタンスの作成

PDF としてダウンロード

バージョン:
最終更新日2025/07/01

ラーニングインスタンスを作成し、トレーニング用のサンプルドキュメントをアップロードします。このステップでは、請求書や発注書などの単一ドキュメントタイプのデータ要素と、抽出するフィールドを定義します。

前提条件

サンプルドキュメントが以下の要件を満たしていることを確認します。

各ドキュメントは独立したファイルです。たとえば、E メールとその添付ファイルを 1 つの PDF にダウンロードした場合、E メールの本文を添付ファイルから分離する必要があります。 [ドキュメントを分割] アクションの使用を参照してください。
ドキュメントは、サポートされている以下のいずれかのファイル形式です。
- PDF
- JPG
- JPEG
- PNG
- Tiff
解像度が 300 ドットパーインチ (dpi) 以上のドキュメントをおすすめします。
ステージング環境では、1 つのラーニングインスタンスにつきファイルサイズ 10MB のドキュメントを最大 150 個までアップロードできます。
本番環境では、1 つのドキュメントにつき最大 50MB のファイルサイズをアップロードできます。ただし、1 つのラーニングインスタンスにつき許可される最大ドキュメント数は、ライセンスによって異なります。
pdfbox OCR では、1 つのドキュメントあたりのページ数に制限はありません。
画像ベースの OCR では、1 つのドキュメントにつき 60 ページをアップロードできます。
アップロードできるファイルサイズは 12MB までです。ラーニングインスタンスが作成された後でも他のドキュメントをアップロードできます。
アップロードするドキュメントのファイル名の先頭は、ハイフン (-) などの特殊文字にしないでください。
テキストを抽出したい場合、抽出したいテキストが次のいずれかの特殊文字で始まる場合: ‘# : , \ ` \'\'、IQ Bot はテキストを取得する際にこれらの特殊文字を無視します。

注:

Tesseract4 OCR で現在、1 つのドキュメントあたりのページ数が 60 ページ未満に制限される既知の制限事項があります。
Azure のコンフィデンシャルコンピューティングにより、組織は暗号化されたデータを、仮想マシン上のプライベートフォルダーなどのセキュリティ保護されたストレージにアップロードできます。そのようなセキュリティ保護されたフォルダーから IQ Bot にドキュメントをアップロードすると、そのようなドキュメントではデータ抽出がサポートされていないため、これらは未分類ステータスに移動されます。

ドキュメントのコレクションをデジタル処理に挿入した場合、ドキュメントのタイプ、形式、向きが混在していると考えられます。たとえば、請求書には一貫したデータ要素セットが含まれていますが、発注書には異なるデータ要素セットが含まれています。以下のステップで、これらのドキュメントタイプごとに異なるラーニングインスタンスを作成する必要があります。

手順

[ラーニングインスタンス] に移動し、[新しいインスタンス] オプションをクリックします。
[新しいラーニングインスタンスを作成] 画面で、次の情報を入力します。
1. インスタンス名: 一意の名前を入力します。
  IQ Bot バージョン A360.21 以前では、重複したラーニングインスタンス名は使用できません。ラーニングインスタンスを削除した場合、名前を再度使用することはできません。 IQ Bot バージョン A360.22 からは、ラーニングインスタンス名の重複作成、および削除したラーニングインスタンス名の再利用が可能になりました。
2. オプション: 説明: 説明を入力します。
3. ドキュメントタイプ: ドロップダウンリストからドキュメントタイプを選択します。
  選択したオプションに基づいて、ドメインタイプに対して事前定義された一連のフォームとテーブルフィールドが表示されます。たとえば、[請求書] を選択すると、請求書の共通のフォームとテーブルが表示されます。
  
  注: この学習インスタンス専用に使用するドメインを作成する場合、[ドキュメントタイプ] > その他を選択し、ドメイン名を入力します。ここからのステップでは、ドメインのカスタマイズを行います。
  カスタムドメインの作成の詳細については、以下のビデオをご覧ください。 <span>カスタムドキュメントタイプの作成</span>
  
  複数のラーニングインスタンスで使用するドメインを作成し、必要なアクセス権限をお持ちの場合、Automation Anywhere サポートと連携してカスタムドメインを作成することができます。詳細は、IQ Bot のカスタムドメインをご覧ください。
4. ドキュメントの主要言語: ドロップダウンメニューを使用して、ラーニングインスタンスの言語を選択します。
  でサポートされている言語Automation 360 IQ Bot
  
  他の言語でカスタムドメインを作成し、IQ Bot が対応している最大 190 の言語にアクセスするには、Automation Anywhere サポートにお問い合わせください。
  重要: IQ Bot インターフェースですべての言語を表示できない場合は、トラブルシューティングを実施します。Unable to extract data from Multiple languages in a document (A-People login required)
5. ドキュメントのアップロード: [参照] オプションをクリックして、サンプルドキュメントをアップロードします。
[共通のフォームフィールド] および [共通のテーブル/繰り返しセクションのフィールド] セクションでフィールドを選択または選択解除します。
請求書の日付や番号など、フォームフィールドはドキュメントに一度だけ表示されます。テーブルフィールドとは、項目の合計や数量など、ドキュメント全体で繰り返し表示されるフィールドのことです。

考えられるすべてのフィールドを表示するには、[追加のフォームフィールド] または [追加のテーブル/繰り返しセクションのフィールド] をクリックします。
オプション: [追加のフォームフィールド] または [追加のテーブル/繰り返しセクションのフィールド] セクションにフィールド名を入力することで、フィールドを追加します。
[フィールドを追加 (任意)] フィールドに名前を入力する時は、次の命名規則に従います。
- フィールド名の最初の文字はアルファベット (A～Z と a～z) でなければなりません。
- フィールド名には英数字と文字、スペースのみ使用できます。
- フィールド名をスペースで終えることはできません。
光学式文字認識: 必要な OCR エンジンを選択します。
OCR エンジンの選択
オプション: [PDF ドキュメントに画像はありません] チェックボックスをオフにします。詳細については、[PDFBox オプションの無効化]をご参照ください。
このチェックボックスがオンの場合、IQ Bot は、PDF ドキュメントの処理に PDFBox OCR を使用します。PDF 以外のドキュメントは、前のステップで選択した OCR によって処理されます。
チェックボックス自動検出: この機能を有効にするには、[チェックボックスを検出] チェックボックスをオンにします。
このオプションを選択すると、IQ Bot がドキュメント内のチェックボックスを自動的に検出できるようになります。ただし、ドキュメントの処理時間が長くなる場合があります。
[インスタンスを作成して分析] ボタンをクリックして、ラーニングインスタンスを作成します。
システムは、フィールド識別に基づいてトレーニングドキュメントを分析して論理グループに分類し、[ラーニングインスタンス] > [概要] タブにその詳細を表示します。

新しいラーニングインスタンスが作成されると、アップロードしたサンプルドキュメントが分析され、ドキュメントの特徴に基づいてグループにソートされます。詳細については、[分類子について]を参照してください。

次のステップ

分類子がドキュメントをソートし終えると、Designer にリダイレクトされます。そこで各サンプルドキュメントからデータを抽出する Bot をトレーニングします。トレーニングインスタンスをトレーニング。

Automation 360