ドキュメント オートメーションおよび IQ Bot v.29 リリース

v.29 リリース対応の IQ Botドキュメント オートメーションの新着情報と変更点、および修正と制限事項について確認してください。

重要: 今回のリリースから、各パッケージの更新に関する情報 (新機能、変更点、修正点、制限事項など) をパッケージ専用ページに移動しました。 [パッケージの更新の概要] > [<パッケージ-name> リリース] に移動することでこれらのページにアクセスできます。

このリリースで更新されたパッケージの統合リストについては、v.29 の更新されたパッケージ を参照してください。

ドキュメント オートメーション

最新情報
オートフィル入力を使用してテーブル データをすばやく検証

検証インターフェースの [オートフィル] ボタンを使用すると、複数ページのテーブルから数百行のデータを抽出することができます。ある列の 3 つのセルを手動で検証した後、オートフィルがドキュメント内のその列から残りの値を抽出します。

ドキュメント オートメーションで Advanced Classifier パッケージを使用

ドキュメント オートメーション Advanced Classifier パッケージを使用すると、ドキュメントやページを分類したり、ドキュメントをフォルダー構造に分割したりすることができます。ドキュメントをフォルダーから各ラーニングインスタンスにアップロードすると、ドキュメント オートメーションでコンテンツを抽出することができます。このパッケージのアクションを含む Bot を実行するには、Skillja のライセンスを Credential Vault で設定する必要があります。

高度な分類子パッケージ

Google Custom Document Extractor のドキュメント オートメーション サポート

ドキュメント オートメーションで、ユーザーがトレーニング済みのラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出できるようになりました。この新機能を使用して、Google CDE を使用したモデルのトレーニングを行い、あらゆるドキュメント タイプに対応し、30 種類の言語をサポートできます。モデルをデプロイした後、ドキュメント オートメーションの抽出プロセス内にプロセッサーの URL を埋め込むことができます。この機能を使用するには、Automation Anywhere Document Workspace のライセンスと Google CDE の有効なサブスクリプションが必要です。

フォームやテーブルの抽出を使用した改善された発見的フィードバック

ドキュメント オートメーションでは、テーブルが複数あるといった複雑なシナリオに焦点を当てた発見的フィードバックにより、抽出機能が改善されています。さらに、抽出機能には、フォーム フィールドと初期状態のパフォーマンスの両方について (特にテーブル フィールドの抽出) に改良が加えられています。

ドキュメント オートメーションのドキュメント レベルのデータ検証

ドキュメント レベルのデータ検証では、ドキュメント内の複数のフィールドにわたって抽出されたデータの精度を保証するルールを作成することができます。パターン マッチングや等価性チェックなど、さまざまな条件を定義することができます。そうした条件を満たしたときに、エラーや警告のフラグ設定、値の整理や置き換え、新しい値の設定などのアクションを簡単に実行することができます。

ドキュメント オートメーションの検証ルール

変更内容
標準フォームでは、Azure AI Document Intelligence v3.0 でのみ、新しいモデルの作成とトレーニングが可能です。Azure AI Document Intelligence v2.1 では、既存のモデルを利用することはできますが、新しいモデルを作成することはできません。
今後のすべてのモデル作成では、ドキュメント オートメーションと統合された Azure AI Document Intelligence Studio は、v.3.0 モデルのみと互換性があります。
Automation 360 v.29 の時点で、ドキュメント オートメーション 標準フォームは、フォームやテーブルのフィールドのチェックボックス タイプに対応しています。標準フォームラーニングインスタンスにチェックボックス フィールド データ タイプが追加され、抽出結果は以下のいずれかになります。
  • オン
  • オフ
  • 未検出 (システムで結果を抽出できない場合)
標準フォーム v.29 より前に作成され、チェックボックス フィールドを持つ Automation 360 ラーニングインスタンスについては、ラーニングインスタンス レベルでチェックボックス フィールドのデータ タイプを更新する必要があります。

ドキュメント オートメーションの検証プロセスを改善するために、検証ツール が強化されています。

Automation 360 v.29 リリース以降、ラーニングインスタンスのエクスポート/インポート機能が強化され、発見的フィードバック データを構成とともにコピーする機能が追加されました。フィードバック データをある環境から別の環境へシームレスに移行することができ、データの損失はありません。この機能の結果として、手直しが大幅に減少し、貴重な時間を削減することができます

ビルド 18345: このビルドには、以下の修正が含まれています (以前のビルドからの修正も含まれています)。

修正
検証ツール では、フィールドに有効なエントリまたはデータを入力し、フィールド以外の場所をクリックすると、そのフィールドが検証されます。

これは以前のビルド 18332、18302、18277 (クラウド-Sandbox)、およびビルド 18324 (オンプレミス) での制限機能でした。

ラーニングインスタンスで [パターンを使用してフィールドを抽出] が選択され、ドキュメントが処理されると、フィールドは有効なデータが入力されると検証されます。ここでは、それぞれのフィールドのみが影響を受け、その抽出は提供された正規表現入力に基づいています。

これは以前のビルド 18332、18302、18277 (クラウド-Sandbox)、およびビルド 18324 (オンプレミス) での制限機能でした。

ビルド 18277: このビルドには、次の修正が含まれています。

修正
検証ツール のテーブル名が 50 文字を超える場合、そのテーブルにカーソルを合わせると、そのテーブルのフィールド名が表示されるようになりました。以前は、テーブル名は表示されませんでした。
検証ツール のフィールド名が 100 文字を超える場合は、スクロール バーが表示され、フォーム フィールドの値を確認できます。以前は、フォーム フィールド名は表示されませんでした。
複数のページを含む v3.0 モデルを作成した場合、実行の分析析結果が 標準フォームに表示されます。
ドキュメント抽出 パッケージからのアクションを含む Bots の高度なチェックアウト オプションを使用できるようになりました。
ドキュメント オートメーション自動作成プロセスではなく、カスタム プロセスにドキュメントをアップロードした場合、[Bot をダウンロード] で、抽出したデータの CSV を正常にダウンロードし、アップロードされたファイルを一時ストレージから削除できるようになりました。
Automation Anywhere Control Room は、新たにインストールされたクラスター Linux 環境におけるドキュメント オートメーション ライセンスの使用量を追跡するようになりました。
インポートされたラーニングインスタンスで、パターンベースの検証がデフォルトで有効になるようになりました。
パイプ記号 (|) を含んでいる正規表現を使用したパターン検証ルールがあるドキュメントを送信できるようになりました。
Bot Insight では、Google Document AI プロバイダーの OCR エンジン属性の [不明] オプションが、Document Workspace ダッシュボードから削除されました。フィルターでは ABBYY が OCR エンジンとして表示するようになり、フィルタリング オプションがより明確で正確になりました。
ドキュメント オートメーションでカスタムドメインを使用してラーニングインスタンスを作成したときに、正常に抽出されるようになりました。以前は、カスタム ドメインを使用してラーニングインスタンス用のドキュメントをアップロードすると、抽出に失敗することがありましたが、この問題は解決されました。

Service Cloud ケース ID: 01967442

Windows OS のユーザー名が 17 文字以上であるドキュメントを、Document Automation の最新パッケージで正常に処理することができるようになりました。従来は、このようなドキュメントを処理しようとすると、次で始まるエラー メッセージが表示されていました:「The File cannot be processed, it may be corrupted (ファイルを処理できません。破損している可能性があります)Please contact technical support if the file is valid. (ファイルが正常な場合は、テクニカル サポートにお問い合わせください)」

Service Cloud ケース ID:01951382、01950245

スタンドアロン設定で出力ファイルをサーバーに保存するオプションが選択されている場合、ドキュメント抽出 パッケージで、正常にドキュメントを抽出できるようになりました。以前は、出力をサーバーにアップロードするオプションを選択すると、エラー メッセージ [抽出] アクションがエラー メッセージDW_EXTRACT_FAILURE 500で失敗することがありました。

Service Cloud ケース ID:01943058、01972932

制限事項
チェックボックス機能 (プレビュー モード内) で、チェックボックス フィールドの抽出に一貫性がなく、結果に矛盾が生じるおそれがあります。このように、システムがチェックボックスのフィールド値を正確に抽出できない場合は、[未検出] というラベルが表示されます。
ラーニングインスタンス名にスペースがある場合、ダウンロードしたファイル名のスペースがエンコードされた値 %20 に置き換えられます。たとえば、エクスポートされたラーニングインスタンス名が Test 123 である場合、ファイル名は Test%20123 と表示されます。
新しいドキュメント レベル ルールの実装により、条件が [フォーム フィールド] に基づいていて、その結果生じるアクションが [テーブル フィールド] に影響するはずの場合、期待される結果が 検証ツール に反映されません。
カスタム エイリアスが含まれるテーブル フィールドに対して、[Extract field using pattern] (パターンを使用してフィールドを抽出) を使用することはできません。

回避策: 正規表現 (regex) を削除すると、カスタム エイリアスで期待通りに抽出が行われます。

Azure AI Document Intelligence Studio UI のテーブル名が 99 文字を超えると、UI ではそれが適切に処理されません。
[正規表現に一致する] 条件と [エラーを表示] アクションで検証ルールを作成すると、抽出のないフィールドに対してカスタム エラーが表示されます。

回避策: 条件が [正規表現に一致する] である場合、別の [AND] と [空ではない] 条件を追加して、[エラーを表示] アクションを使用します。これにより、抽出のないフィールドではエラーが表示されません。

ラーニングインスタンスの作成または編集中に、[パターンを使用してフィールドを抽出] チェックボックスを選択し、その後正規表現フィールドに値を入力せずにチェックボックスをオフにすると、他のすべての必須フィールドが入力されていても、[作成] ボタンは無効のままになります。

回避策: 正規表現フィールドに値を入力し、[パターンを使用してフィールドを抽出] チェックボックスをオフにします。

Process Composer で [中国語] を選択すると、自動入力ボタンのラベルが更新されず、検証中に選択した言語が反映されません。
Google Custom Document Extractor でドキュメントを処理すると、次の言語での抽出に失敗します。
  • アルバニア語
  • クロアチア語
  • フィンランド語
  • アイスランド語
  • スロベニア語
  • ベトナム語
(Service Cloud ケース ID: 01981332, 01981088) 抽出中、発見的フィードバックは、以前のマッピングに英語以外の言語 (アラビア文字や単一引用符「'」を含むテキスト) が含まれている場合、特定のフィールドの値を提供されません。
ラーニングインスタンスの編集中に [] や [] ボタンで [信頼度] レベルの値を変更して、[更新] ボタンをクリックしても、変更内容が保持されません。

回避策: [信頼度] レベルの増減値が入力されていることを確認してください。

Community Edition 向け:
  • Google Vision OCR は、サポートされていないため表示されません。
  • Google CDE または Google Document AI (ユーザー定義) を使用したドキュメント抽出は、サポートされていません。

IQ Bot

修正
Automation 360 IQ Bot から接続されたラーニングインスタンスを初めてクリックすると、そのラーニングインスタンスの詳細ページにリダイレクトされます。以前は、代わりに IQ Bot のホーム ページにリダイレクトされていました。
マニュアル グループに破損したドキュメントをアップロードした場合に、Automation 360 IQ Bot で正しいエラー メッセージが表示されるようになりました。

[トレーニング] と [再トレーニング] のアクションで 54 を超えるカテゴリを使用できるようになりました。これにより、提供されたトレーニング モデル ファイルに従って分類することができます。以前は、カテゴリが 54 を超える場合、Classifier でファイルをカテゴリに分類することができませんでした。

子タスク Bot の変数を使用して、ドキュメント分類子 パッケージを作成および実行できるようになりました。以前は、子タスク Bot を呼び出すために、変数を指定してタスク Bot のコマンドを実行すると、エラーが表示されていました。

テスト実行後に全画面から全画面解除に移行する際に、[Python ロジック] タブに追加される Python スクリプトの全文を表示できるようになりました。[テスト実行]、[ボックスを消去]、[全画面]、[保存] などのオプションもすべて表示されます。以前は、全画面から全画面解除に移行したときに、Python スクリプトを表示できず、他のオプションはすべて非表示になっていました。

IQ Bot インスタンスのヘルスチェックで、インスタンスがアイドル状態または 1 日後にアクセスされた場合でも、正しい [OK] ステータスが表示されます。以前は、IQ Bot インスタンスがアイドル状態または 1 日後にアクセスされた場合、ヘルスチェックで [NOT_OK] というステータスが表示されていました。

最大ファイル サイズ 5GB までの IQ Bot アーカイブ (IQBA) ファイルのエクスポート、インポート、アップロード、ダウンロードができるようになりました。

以前は、IQ Bot ファイル サイズが 268MB より大きい場合、エクスポートされたファイルが出力フォルダーから目的の場所にアップロードされませんでした。

これで、IQBA ファイルをラーニングインスタンスに正常にインポートできるようになりました。以前は、エクスポートされたラーニングインスタンスに改行文字を含む特定のトレーニングが埋め込まれている場合、IQBA のインポートに失敗していました。

インターフェースの更新

Automation 360 v.29 リリース用ドキュメント オートメーションのインターフェースに加えられたインターフェース更新を確認してください。

ドキュメント レベルのデータ検証では、ドキュメント内の複数のフィールドにわたって抽出されたデータの精度を保証するルールを作成することができます。

抽出を改善するためのドキュメントレベルのルール

発見的フィードバック データを構成とともにコピーする機能を伴う、エクスポートとインポートの機能を活用することができます。

ラーニングインスタンスのエクスポートとインポートにおける検証フィードバック

ドキュメント オートメーションで、ユーザーによりトレーニングされたラーニングインスタンスを作成し、Google Custom Document Extractor (CDE) プロセッサーを使用して抽出します。

Google Custom Document Extractor (CDE) のサポート

新しいモデルの作成とトレーニングは、Azure AI Document Intelligence v3.0 を使用した場合のみ可能です。

標準フォームの v3.0 モデルへの対応