ドキュメント抽出 パッケージの更新

新機能や拡張機能、修正や制限など、ドキュメント抽出 パッケージのリリース バージョンの更新を確認してください。このページには、各バージョンのリリース日、互換性のある Control Room および Bot エージェントのバージョンも表示されます。

バージョンの概要

次の表では、Automation 360 のリリースに伴いリリースされた、またはパッケージのみのリリースとしてリリースされた ドキュメント抽出 パッケージのバージョンをリストで示しています (リリース日の降順)。バージョン リンクをクリックすると、当該パッケージ バージョンの更新に関する情報が表示されます。
バージョン リリース日 リリース タイプ Bot エージェント バージョン Control Room ビルド
ドキュメント抽出 パッケージの更新 2024 年 4 月 5 日 Automation 360 v.32 (オンプレミス) リリース 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2024 年 3 月 21 日 Automation 360 v.32 (Sandbox) リリースに伴う 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2024 年 1 月 26 日 パッケージのみ: Automation 360 v.31 リリース後 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 12 月 22 日 パッケージのみ: Automation 360 v.31 (Sandbox) リリース後 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 12 月 6 日 Automation 360 v.31 (Sandbox) リリースに伴う 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 11 月 28 日 Automation 360 v.30 リリース 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 11 月 16 日 パッケージのみ: Automation 360 v.30 リリース後 21.252 またはそれ以降 19223 またはそれ以降
3.30.24 2023 年 9 月 21 日 パッケージのみ: Automation 360 v.30 (Sandbox) リリース後 21.252 またはそれ以降 19223 またはそれ以降
3.30.22 2023 年 9 月 6 日 Automation 360 v.30 (Sandbox) リリースに伴う 21.252 またはそれ以降 19223 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 8 月 21 日 パッケージ のみ: Automation 360 v.29 後 21.98 またはそれ以降 15345 またはそれ以降
3.30.19 2023 年 8 月 16 日 パッケージ のみ: Automation 360 v.29 後 21.98 またはそれ以降 15345 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 7 月 17 日 パッケージのみ: Automation 360 v.29 リリース後 21.98 またはそれ以降 15345 またはそれ以降
ドキュメント抽出 パッケージの更新 2023 年 6 月 6 日 Automation 360 v.29 (Sandbox) リリースに伴う 21.98 またはそれ以降 15345 またはそれ以降
注:
  • 個々のパッケージ (パッケージのみが必要な Automation 360 リリースで更新済み) をダウンロードするには、この URL を使用してください。

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • ドキュメント抽出 パッケージの場合、命名規則は次のようになります。bot-command-iqbot-extraction360-<version-number>-full.jar

    たとえば、bot-command-iqbot-extraction360-3.31.22-full.jar です。

パッケージをダウンロードし、手動で Control Room に追加する手順の詳細については、「Control Room に パッケージ を追加」を参照してください。

3.32.23

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
プロキシが Bot エージェント マシンで有効になっている場合、ユーザーは検証フィードバックをDocument Automation環境に保存できるようになりました。

Service Cloud ケース ID: 02092484

Google Vision OCR とプロキシを有効にした場合、非構造化ドキュメントのドキュメント抽出が失敗しなくなり、エラー メッセージも表示されなくなりました。

Service Cloud ケース ID: 02104409

3.32.22

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
ドキュメント テーブル検出モデルに対する改善として [テーブルの末尾インジケータ] を追加したことにより、選択した言語のすべてのページからテーブル データを抽出できるようになりました。したがって、ページでのテーブルの欠落や最終行の抽出の問題が軽減されます。

Service Cloud ケース ID: 02065073

テーブル抽出機能の向上により、非構造化テーブルにジャンク値が表示されなくなり、テーブル データが正常に抽出されるようになりました。

3.31.22

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
ラーニングインスタンスに検証フィードバックを追加した後、ドキュメントの抽出に失敗してエラー メッセージが表示されることはなくなりました。

以前は、検証チェック ボックスがオンの場合、ドキュメントの抽出に失敗していました。

検証フィードバックをラーニングインスタンスに追加した後、ドキュメントのすべてのページのすべてのテーブルに対してフィードバックが保存され、すべてのページからデータが正しく抽出されます。

以前は、フィードバックはすべてのページに対して保存されていませんでした。

Service Cloud ケース ID: 01995135、02093575、02093389

検証フィードバックを追加した後、テーブル ID が一致すれば、すべてのページのすべてのテーブルからデータが抽出され、検証ツールに表示されるようになりました。

以前はこのような場合、一部のページがスキップされ、全ページのデータが検証ツールに表示されるわけではありませんでした。

高度なトレーニング設定を適用する場合、列を入れ替え、すべての列の値を正しくマッピングする必要があります。その結果、データは別々の列に正しく抽出されます。すべての列セルを再マッピングするか、最初の 2 行はそのままに他の不正確なセル行をすべて削除するかを選択できます。列の中に不正確なセルはあってはならず、すべての列セルは正しい値を持つ必要があります。

以前はこのような場合、2 つの列のデータが 1 つの列に抽出されていました。

テーブル フィールド値を正しい順序で抽出できるようになり、複数行の抽出の問題は発生しなくなりました。また、[テーブルの末尾インジケータ] 機能を使用すると、テーブルに 1 行しかない場合にフィードバック データを適用した後に複数行を抽出することができます。
注: 単一行のテーブルに対しては [テーブルの末尾インジケータ] 機能を使うのがベスト プラクティスです。そうしない場合、特定のシナリオにおいて抽出が部分的になる可能性があります。

Service Cloud ケース ID: 02091013

ドキュメントをトレーニングした後、ユーザーが同じドキュメントを Google Vision OCR で再処理すると、フィードバックが保存され、必要なデータが抽出されます。

以前は、このような場合、特定のタイプのドキュメントを処理できず、その都度手作業でドキュメントを検証する必要がありました。

Service Cloud ケース ID: 02098682

3.31.17

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
Google Vision OCR を使用することで、Google Document AI ライセンスがなくてもドキュメントを正常に処理できるようになりました。また、エラー メッセージも発生しません。

以前は、ドキュメントを処理するために Google Document AI ライセンスを要求し、ドキュメントの抽出中にエラーが発生していました。このため、Google Vision OCR を使用してドキュメントを抽出することができませんでした。

Service Cloud ケース ID: 02097428、02096992、02097798、02097157、02098378、02098563、02094573

3.31.16

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
ユーザーが Google Document AI (BYOK) と、認証されたプロキシでラーニングインスタンスを作成した場合、10 ページ以上のドキュメントでドキュメント抽出が失敗しなくなりました。

以前は、このような場合エラー メッセージが表示され抽出が失敗し、ユーザーはドキュメントを処理することができませんでした。

3.31.15

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
[ドキュメント ルール] に、グループを含む、または含んでいない [AND] 演算子を使用した複数の条件がある場合、適切なエラー メッセージが表示されるようになりました。また、対応するアクションがフィールドに適用されるようになりました。

3.31.13

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
変更内容
Document Automationの非構造化ドキュメントの抽出を改善すると、次のことを実行できます。
  • 複雑なクエリの効果的な処理。
  • 向上した関連ページへのナビゲーションによるドキュメントの検証。
修正
ABBYY OCR エンジンを使用したテーブル抽出の改善により、発見的フィードバックが正しく機能するようになりました。
  • ドイツ語では、フィードバックを適用すると請求書抽出が正しく機能し、すべてのテーブル データが抽出されます。
  • スペイン語では、請求書ドキュメントからテーブル データが正しく抽出されます。
  • 英語では、請求書データは ABBYY OCR を含むすべてのページから抽出されます。

Service Cloud ケース ID: 01995901

テーブルが複数ページに展開されている PDF ファイルからテーブル データを抽出した場合、発見的フィードバックの適用後にすべてのページのデータが正常に抽出されます。

以前は、テーブルが複数ページに展開されている PDF ファイルの 2 ページ目のデータを抽出できませんでした。

Service Cloud ケース ID: 01996536

すべてのフィールドについて最初のページからの抽出を開始すると、複数行のテーブル データ キャプチャの発見的フィードバックが正しく機能し、正しい出力を生成するようになりました。

以前は、発見的フィードバックが提供されても、複数行のテーブル データは抽出されませんでした。その結果、出力が正しく生成されませんでした。

Service Cloud ケース ID: 01944805、01946809、01952836、01957090、01975800、01981088、01944805、01946809、01952836、01957090

Microsoft 標準フォームでは、セルが空の場合もテーブル抽出に失敗することがなくなり、ユーザーはドキュメントを正常に抽出できるようになりました。
ユーザーがラーニングインスタンスをインポートし、ドキュメントを処理したときに、抽出されたドキュメントですべてのページに正しい日付の順序が表示されます。
ユーザーがラーニングインスタンスをインポートし、ドキュメントを処理したときに、抽出後のテーブルにすべての値が表示されます。

以前は、このような場合、システム識別領域 (SIR) がハイライト表示されていましたが、テーブルに空の値が表示されていました。

ユーザーが発見的フィードバックを含む .dw ファイルをインポートし、最後の行に (-) の値を含むドキュメントを処理すると、最後の行にある負の値をスキップせずにドキュメントが正しく抽出されます。

以前は、このような場合では、最後の行がスキップされ、データが失われたり、誤った処理が行われたりしていました。

ユーザーがテーブルを含むドキュメントを処理する場合、DOCUMENT_PARTIALLY_FAILED または Extraction Timeout エラー メッセージが表示されずに抽出が正常に終了します。

以前は、このような場合では、同じテーブルからの複数検出により、一部のドキュメントが抽出されず、テーブル サイズ (max () arg) の問題が発生していました。

ユーザーがラーニングインスタンスをインポートし、ドキュメントを処理する場合、すべてのページからすべての行が個別に抽出されます。

以前は、2 ページ目の行が 1 行に統合されていました。

制限事項
ユーザーが Google Vision OCR を使用している場合、テーブルの検出や抽出は機能しません。

回避策: ABBYY OCR エンジンの使用を推奨します。

Service Cloud ケース ID: 01995901

テーブルが複数のページにまたがり、すべてのページにヘッダーがない (ヘッダー レス ページ) 場合、フィードバックを適用した後、すべてのページからデータが抽出されない場合があります。

3.30.24

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
修正
発見的フィードバックを使用することで、2 行目から抽出されたデータを正しく表示できるようになりました。
[購入注文] ドキュメント タイプでは、すべてのページからテーブル フィールド値を正しく抽出できるようになりました。
生成されたフィードバック ファイルにはエラー メッセージが表示されなくなり、ユーザーはドキュメントを正常に処理できるようになりました。

3.30.22

  • 互換性のある Bot エージェント バージョン: 21.252 またはそれ以降
  • 互換性のある Control Room バージョン: 19223 またはそれ以降
最新情報
Document Automationは、新しい [ドキュメント データの取得] と [ドキュメント データの更新] アクションを通して、改良された抽出を提供します。これらのアクションを使用して、データ操作と検証のためのカスタム ロジックを適用し、ストレートスルー処理 (STP) を最大化し、手作業による検証作業を削減することができます。

3.30.21

  • 互換性のある Bot エージェント バージョン: 21.98 またはそれ以降
  • 互換性のある Control Room バージョン: 15345 またはそれ以降
修正
このドキュメント抽出パッケージ リリースは、一部のドキュメントの処理中に発生した「501: DOCUMENT_PARTIALLY_FAILED」エラーを修正するパッチです。

3.30.19

  • 互換性のある Bot エージェント バージョン: 21.98 またはそれ以降
  • 互換性のある Control Room バージョン: 15345 またはそれ以降
修正
ドキュメント抽出パッケージは、複雑なテーブル ヘッダー列を抽出する機能を改善しました。
  • シナリオ 1: 複数のヘッダーが 1 つの列にマージされたテーブルの列ヘッダーからデータを抽出する。
  • シナリオ 2: 複数に分割されたサブヘッダーを持つテーブルの列ヘッダーからデータを抽出する。
次の手順に従って、テーブル ヘッダーのデータ抽出を改善できるようにします。
  1. ラーニングインスタンスを作成するか編集します。
  2. テーブル フィールドを追加または編集するには、[テーブル フィールド] タブに移動し、[フィールドを追加] > [フィールドのプロパティ] をクリックします。
  3. 各テーブル ヘッダーを別々のテーブル フィールドとして追加します。例:

    シナリオ 1: 列ヘッダーと、マージされた各サブヘッダーを別々のテーブル フィールドとして追加します。スクリーンショットを参考にして、3 つのマージされた列ヘッダー フィールドからデータを抽出し、3 つの個別のテーブル フィールド (エイリアス CGST を持つ CGST、エイリアス SGST を持つ SGST、エイリアス CESS を持つ CESS など) を作成します。

    複数のサブヘッダーを持つ列ヘッダーの例。

    シナリオ 2: 列ヘッダーと、分割された各サブヘッダーを別々のテーブル フィールドとして追加します。上記の例と同様に、列ヘッダー CGST に分割されたサブヘッダー Rate と AMT がある場合、エイリアス CGST Rate を持つ CGST Rate テーブル フィールドと、エイリアス CGST AMT を持つ CGST AMT テーブル フィールドの 2 つを作成する必要があります。

    複数の分割サブヘッダーを持つ列ヘッダーの例。

  4. [送信] をクリックして、更新内容を保存します。

3.29.17

  • 互換性のある Bot エージェント バージョン: 21.98 またはそれ以降
  • 互換性のある Control Room バージョン: 15345 またはそれ以降
修正
ドキュメント抽出パッケージで、フォーム フィールドとテーブル フィールドの両方に対して抽出機能の修正が行われました。

3.29.14

  • 互換性のある Bot エージェント バージョン: 21.98 またはそれ以降
  • 互換性のある Control Room バージョン: 15345 またはそれ以降
最新情報
Document Automationでは、テーブルが複数あるといった複雑なシナリオに焦点を当てた発見的フィードバックによる向上した抽出機能を提供します。さらに、抽出機能には、フォーム フィールドと初期状態のパフォーマンスの両方について (特にテーブル フィールドの抽出) に改良が加えられています。