IQ Bot Extraction package
- 最終更新日2021/06/09
IQ Bot Extraction packageは、請求書から値を自動的に抽出することで、コンテンツ抽出機能を強化します。
ラーニング インスタンスは、コンテンツ抽出のためのサンプル ドキュメントのトレーニングを可能にする IQ Bot 環境です。ラーニング インスタンスを常に改良することで、本番環境全体にラーニング インスタンスを配置する前に、コンテンツ抽出精度を高めることができます。
IQ Bot Extraction packageは、ラーニング インスタンス (新規または既存) と事前トレーニング済みの機械学習モデルを組み合わせて、コンテンツを自動的に抽出します。事前トレーニング済みの機械学習モデルは、データ ポイントを使用して、サポートされているドキュメント タイプからコンテンツを抽出します。既存のラーニング インスタンスに追加のトレーニングを提供することで、他のドキュメント タイプからもコンテンツを抽出できます。
IQ Bot Extraction packageでは、以下の抽出方法が可能になります。
最小限のトレーニングでのコンテンツ抽出
さまざまな請求書から販売データを抽出するシナリオを考えてみましょう。データの抽出に使用する事前トレーニング済みのドメインまたはドキュメント タイプを選択して、ラーニング インスタンスを作成します。このシナリオでは、ドキュメント タイプを請求書として選択できます。このドキュメント タイプでは、コンテンツ抽出用の一連のプリセット フィールドが提供されます。参照用として、サンプルの請求書ドキュメントを必ずアップロードします。ラーニング インスタンス グループの追加トレーニングは必要ありません。IQ Bot Extraction packageを使用して、このラーニング インスタンスを bot にリンクします。この bot を実行すると、さまざまな請求書のプリセット フィールドに基づいて販売データを取得できます。
追加トレーニングによる抽出の強化
IQ Bot Extraction packageは、バックエンドのエンジンと IQ Bot サーバーを組み合わせて使用し、ドキュメント抽出を強化します。既存のラーニング インスタンスを使用して、利用可能なすべてのドキュメント グループ用に追加のトレーニングを提供できます。ラーニング インスタンス グループのさまざまなフィールドと検証設定をカスタマイズすることで、このpackage コンテンツ抽出を他のドキュメント タイプに使用できます。
- Automation Anywhere サポート サイトからpackageをダウンロードします。packageは、IQ Bot Installation Setup フォルダーにある .jar ファイルです。
- packageを Control Room にアップロードします。
開始前
- ABBYY FineReader Engine OCR 12.4 エンジンを使用してラーニング インスタンスを作成します。
その他の利用可能な OCR エンジンは次のとおりです。
- Tesseract4 OCR
- Microsoft Azure Computer Vision OCR engine 3.2
- Tegaki (Automation 360 IQ Bot Cloud では利用不可)
- 一般的なレイアウトのドキュメントを選択します。
事前トレーニング済みモデルには、論理グループが含まれています。エラーのあるドキュメントが Success フォルダーに入らないように、デフォルトの検証ルールのために既存のグループを選択することが重要です。
[IQ Bot Extraction] package内のAction
Action | 説明 |
---|---|
IQ Bot 抽出 | 「[IQ Bot ドキュメントを処理] action の使用」を参照してください。 |
IQ Bot Extraction packageを使用する方法については、次のビデオをご覧ください: