ドキュメント抽出 パッケージの更新

新機能や拡張機能、修正や制限など、ドキュメント抽出 パッケージのリリース バージョンの更新を確認してください。 このページには、各バージョンのリリース日、互換性のある Control Room および Bot エージェントのバージョンも表示されます。

バージョンの概要

次の表では、ドキュメント抽出 のリリースに伴いリリースされた、またはパッケージのみのリリースとしてリリースされた パッケージ Automation 360のバージョンをリストで示しています (リリース日の降順)。 バージョン リンクをクリックすると、当該パッケージ バージョンの更新に関する情報が表示されます。
バージョン リリース日 リリース タイプ Bot エージェント バージョン Control Room ビルド
ドキュメント抽出 パッケージの更新 2024 年 9 月 27 日 Automation 360 v.34 (Sandbox) リリースに伴う 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 7 月 15 日 パッケージのみ: Automation 360 v.33 リリース後 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 6 月 14 日 パッケージのみ: Automation 360 v.32 リリース後 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 6 月 26 日 Automation 360 v.33 (オンプレミス) リリース 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 4 月 18 日 パッケージのみ: Automation 360 v.32 リリース後 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 4 月 5 日 Automation 360 v.32 (オンプレミス) リリース 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 3 月 21 日 Automation 360 v.32 (Sandbox) リリースに伴う 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2024 年 1 月 26 日 パッケージのみ: Automation 360 v.31 リリース後 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2023 年 12 月 22 日 パッケージのみ: Automation 360 v.31 (Sandbox) リリース後 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2023 年 12 月 6 日 Automation 360 v.31 (Sandbox) リリースに伴う 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2023 年 11 月 28 日 Automation 360 v.30 リリース 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2023 年 11 月 16 日 パッケージのみ: Automation 360 v.30 リリース後 21.252 以降 19223 以降
3.30.24 2023 年 9 月 21 日 パッケージのみ: Automation 360 v.30 (Sandbox) リリース後 21.252 以降 19223 以降
3.30.22 2023 年 9 月 6 日 Automation 360 v.30 (Sandbox) リリースに伴う 21.252 以降 19223 以降
ドキュメント抽出 パッケージの更新 2023 年 8 月 21 日 パッケージ のみ: Automation 360 v.29 後 21.98 以降 15345 以降
3.30.19 2023 年 8 月 16 日 パッケージ のみ: Automation 360 v.29 後 21.98 以降 15345 以降
ドキュメント抽出 パッケージの更新 2023 年 7 月 17 日 パッケージのみ: Automation 360 v.29 リリース後 21.98 以降 15345 以降
ドキュメント抽出 パッケージの更新 2023 年 6 月 6 日 Automation 360 v.29 (Sandbox) リリースに伴う 21.98 以降 15345 以降
注:
  • 個々のパッケージ (Automation 360のみが必要な パッケージ リリースで更新済み) をダウンロードするには、この URL を使用してください。

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • ドキュメント抽出 パッケージの場合、命名規則は次のようになります。bot-command-iqbot-extraction360-<version-number>-full.jar

    たとえば、Bot-command-iqbot-extraction360-3.31.22-full.jar です。

パッケージをダウンロードし、手動で Control Room に追加する手順の詳細については、「Control Room に パッケージ を追加」を参照してください。

3.34.7

変更内容
テーブル抽出モデルの強化

テーブル抽出モデルが更新され、テーブルの終わりを示すインジケーター オプションが強化されました。

Service Cloud ケース ID: 02145073, 02154694, 02160765

修正

ドキュメント タイプを [非構造化] ドキュメントに設定し、言語を [スウェーデン語] に設定してラーニングインスタンスを作成する場合、ドキュメント抽出により、スウェーデン語の非構造化ドキュメント タイプからデータが正常に抽出されます。

生成 AI モデルの検索クエリ オプションでクエリを提供し、エラーを表示せずにパッキングリスト文書からデータを正常に抽出できます。

以前は、そのようなシナリオで特定のクエリを提供したときにエラーが表示されていました。

Service Cloud ケース ID: 02154341, 02154706

セキュリティ上の脆弱性の問題を修正。 詳細については、リリースのダウンロード リンクをクリックし、A-People Downloads page (Login required)のセキュリティとコンプライアンスに関するレポートをご覧ください。

3.33.18

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
最新情報

すぐに使用できる Anthropic 統合

Anthropic 生成 AI プロバイダーを、追加設定なしで直接使用できるようになりました。

Document Automationにラーニングインスタンスを作成

変更内容
テーブル抽出モデルの強化

テーブル抽出モデルが更新され、非構造化ドキュメント タイプを対象とした複数ページにまたがるテーブルのデータ抽出が改善されました。

修正

生成 AI プロバイダーを使用してデータを抽出する際に、検索クエリ内で JSON 形式での応答をリクエストした場合、フィールドが適切な値を返します。

以前は、このようなシナリオで、特定のフィールドが空の値を返していました。

3.33.13

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
変更内容
テーブル抽出モデルの改善 (Service Cloud ケース ID: 02122434)

テーブル抽出モデルが更新され、テーブル構造の抽出とエラー処理が改善されました。

修正
ラーニングインスタンスの標準の [vendor_name] フォーム フィールドに検証フィードバックを提供し、ベンダー名を正常に抽出できるようになりました。

以前は、このような場合にエラーが発生していました。

Service Cloud ケース ID: 02124772, 02122434, 02126627, 02129868, 02132605

複数のページとテーブルを含むドキュメントの場合、検証ツールの詳細トレーニング設定にあるすべてのテーブルのプライマリ列とテーブルの末尾インジケータ フィールドは、検証フィードバックの提供後に適切に更新されます。

以前は、プライマリ列とテーブルの末尾インジケータ フィールドがすべてのテーブルで更新されるわけではありませんでした。

ラーニングインスタンスがある複数のテーブルを含むドキュメントを処理するときに、検証フィードバックが複数のテーブルに対して機能するようになりました。
制限事項
次のシナリオでは、データ抽出が失敗します。
  • ドキュメント タイプが [非構造化ドキュメント] に設定されており、言語が [スウェーデン語] に設定されている状態でラーニングインスタンスを作成する。
  • ラーニングインスタンスの抽出 Bot が、ドキュメント抽出 パッケージのバージョン 3.33.13 を使用している。

3.33.11

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
ラーニングインスタンスを使ってドキュメントを処理することが、次の場合にできるようになりました。
  • ラーニングインスタンスが IQ Bot のチェックボックス フィールドで作成された。
  • ラーニングインスタンスが Document Automation - IQ Bot Bridge パッケージを使用してDocument Automationにインポートされている。
  • のラーニングインスタンスで、[検証を使用して精度を改善] オプションが有効になっているDocument Automation

以前は、そのようなシナリオではデータ抽出に失敗していました。

3.32.26

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
ドキュメントを Google Document AI で処理すると、抽出 Bot が [ポルトガル語] の言語で正常に実行され、ドキュメントが検証ツールに送られるようになりました。

手書きオブジェクトや署名オブジェクトを使ってドキュメントを処理すると、これらのオブジェクトが最終的な出力 JSON ファイルに含まれるようになりました。

以前は、署名の信頼度のしきい値が高く設定されていたため、手書きや署名のオブジェクトは最終的な出力 JSON ファイルには含まれませんでした。

BYOK (Bring Your Own Key) 設定で Google Custom Document Extractor (CDE) を使用してドキュメントを処理し、対応するプロセッサーが基礎モデルを使用している場合、変換の失敗によりドキュメント処理が失敗しなくなりました。
複雑なテーブルのカラム検出のために特別に改良されたテーブル構造モデルにより、より正確な抽出結果を得ることができます。

Service Cloud ケース ID: 02110860

IQ Bot からDocument Automationにブリッジされたラーニングインスタンスでは、検証フィードバックが有効化されて検証フィードバックが適用され、ユーザーが次のドキュメントを処理すると、すべてのページからのデータが、マージされた行なしで正常に抽出されるようになりました。

3.32.23

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
セキュリティ スキャンで報告された脆弱性を修正。

3.32.22

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
ドキュメント テーブル検出モデルに対する改善として [テーブルの末尾インジケータ] を追加したことにより、選択した言語のすべてのページからテーブル データを抽出できるようになりました。 したがって、ページでのテーブルの欠落や最終行の抽出の問題が軽減されます。

Service Cloud ケース ID: 02065073

テーブル抽出機能の向上により、非構造化テーブルにジャンク値が表示されなくなり、テーブル データが正常に抽出されるようになりました。
プロキシが Document Automation マシンで有効になっている場合、ユーザーは検証フィードバックをBot エージェント環境に保存できるようになりました。

Service Cloud ケース ID: 02092484

Google Vision OCR とプロキシを有効にした場合、非構造化ドキュメントのドキュメント抽出が失敗しなくなり、エラー メッセージも表示されなくなりました。

Service Cloud ケース ID: 02104409

3.31.22

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
ラーニングインスタンスに検証フィードバックを追加した後、ドキュメントの抽出に失敗してエラー メッセージが表示されることはなくなりました。

以前は、検証チェック ボックスがオンの場合、ドキュメントの抽出に失敗していました。

検証フィードバックをラーニングインスタンスに追加した後、ドキュメントのすべてのページのすべてのテーブルに対してフィードバックが保存され、すべてのページからデータが正しく抽出されます。

以前は、フィードバックはすべてのページに対して保存されていませんでした。

Service Cloud ケース ID: 01995135, 02093575, 02093389

検証フィードバックを追加した後、テーブル ID が一致すれば、すべてのページのすべてのテーブルからデータが抽出され、検証ツールに表示されるようになりました。

以前はこのような場合、一部のページがスキップされ、全ページのデータが検証ツールに表示されるわけではありませんでした。

高度なトレーニング設定を適用する場合、列を入れ替え、すべての列の値を正しくマッピングする必要があります。 その結果、データは別々の列に正しく抽出されます。 すべての列セルを再マッピングするか、最初の 2 行はそのままに他の不正確なセル行をすべて削除するかを選択できます。 列の中に不正確なセルはあってはならず、すべての列セルは正しい値を持つ必要があります。

以前はこのような場合、2 つの列のデータが 1 つの列に抽出されていました。

テーブル フィールド値を正しい順序で抽出できるようになり、複数行の抽出の問題は発生しなくなりました。 また、[テーブルの末尾インジケータ] 機能を使用すると、テーブルに 1 行しかない場合にフィードバック データを適用した後に複数行を抽出することができます。
注: 単一行のテーブルに対しては [テーブルの末尾インジケータ] 機能を使うのがベスト プラクティスです。 そうしない場合、特定のシナリオにおいて抽出が部分的になる可能性があります。

Service Cloud ケース ID: 02091013

ドキュメントをトレーニングした後、ユーザーが同じドキュメントを Google Vision OCR で再処理すると、フィードバックが保存され、必要なデータが抽出されます。

以前は、このような場合、特定のタイプのドキュメントを処理できず、その都度手作業でドキュメントを検証する必要がありました。

Service Cloud ケース ID: 02098682

3.31.17

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
Google Vision OCR を使用することで、Google Document AI ライセンスがなくてもドキュメントを正常に処理できるようになりました。 また、エラー メッセージも発生しません。

以前は、ドキュメントを処理するために Google Document AI ライセンスを要求し、ドキュメントの抽出中にエラーが発生していました。 このため、Google Vision OCR を使用してドキュメントを抽出することができませんでした。

Service Cloud ケース ID: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
ユーザーが Google Document AI (BYOK) と、認証されたプロキシでラーニングインスタンスを作成した場合、10 ページ以上のドキュメントでドキュメント抽出が失敗しなくなりました。

以前は、このような場合エラー メッセージが表示され抽出が失敗し、ユーザーはドキュメントを処理することができませんでした。

3.31.15

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
[ドキュメント ルール] に、グループを含む、または含んでいない [AND] 演算子を使用した複数の条件がある場合、適切なエラー メッセージが表示されるようになりました。 また、対応するアクションがフィールドに適用されるようになりました。

3.31.13

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
変更内容
Document Automationの非構造化ドキュメントの抽出を改善すると、次のことを実行できます。
  • 複雑なクエリの効果的な処理。
  • 向上した関連ページへのナビゲーションによるドキュメントの検証。
修正
ABBYY OCR エンジンを使用したテーブル抽出の改善により、発見的フィードバックが正しく機能するようになりました。
  • ドイツ語では、フィードバックを適用すると請求書抽出が正しく機能し、すべてのテーブル データが抽出されます。
  • スペイン語では、請求書ドキュメントからテーブル データが正しく抽出されます。
  • 英語では、請求書データは ABBYY OCR を含むすべてのページから抽出されます。

Service Cloud ケース ID: 01995901

テーブルが複数ページに展開されている PDF ファイルからテーブル データを抽出した場合、発見的フィードバックの適用後にすべてのページのデータが正常に抽出されます。

以前は、テーブルが複数ページに展開されている PDF ファイルの 2 ページ目のデータを抽出できませんでした。

Service Cloud ケース ID: 01996536

すべてのフィールドについて最初のページからの抽出を開始すると、複数行のテーブル データ キャプチャの発見的フィードバックが正しく機能し、正しい出力を生成するようになりました。

以前は、発見的フィードバックが提供されても、複数行のテーブル データは抽出されませんでした。 その結果、出力が正しく生成されませんでした。

Service Cloud ケース ID: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Microsoft 標準フォームでは、セルが空の場合もテーブル抽出に失敗することがなくなり、ユーザーはドキュメントを正常に抽出できるようになりました。
ユーザーがラーニングインスタンスをインポートし、ドキュメントを処理したときに、抽出されたドキュメントですべてのページに正しい日付の順序が表示されます。
ユーザーがラーニングインスタンスをインポートし、ドキュメントを処理したときに、抽出後のテーブルにすべての値が表示されます。

以前は、このような場合、システム識別領域 (SIR) がハイライト表示されていましたが、テーブルに空の値が表示されていました。

ユーザーが発見的フィードバックを含む .dw ファイルをインポートし、最後の行に (-) の値を含むドキュメントを処理すると、最後の行にある負の値をスキップせずにドキュメントが正しく抽出されます。

以前は、このような場合では、最後の行がスキップされ、データが失われたり、誤った処理が行われたりしていました。

ユーザーがテーブルを含むドキュメントを処理する場合、DOCUMENT_PARTIALLY_FAILED または Extraction Timeout エラー メッセージが表示されずに抽出が正常に終了します。

以前は、このような場合では、同じテーブルからの複数検出により、一部のドキュメントが抽出されず、テーブル サイズ (max () arg) の問題が発生していました。

ユーザーがラーニングインスタンスをインポートし、ドキュメントを処理する場合、すべてのページからすべての行が個別に抽出されます。

以前は、2 ページ目の行が 1 行に統合されていました。

制限事項
ユーザーが Google Vision OCR を使用している場合、テーブルの検出や抽出は機能しません。

回避策: ABBYY OCR エンジンの使用を推奨します。

Service Cloud ケース ID: 01995901

テーブルが複数のページにまたがり、すべてのページにヘッダーがない (ヘッダー レス ページ) 場合、フィードバックを適用した後、すべてのページからデータが抽出されない場合があります。

3.30.24

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
修正
発見的フィードバックを使用することで、2 行目から抽出されたデータを正しく表示できるようになりました。
[購入注文] ドキュメント タイプでは、すべてのページからテーブル フィールド値を正しく抽出できるようになりました。
生成されたフィードバック ファイルにはエラー メッセージが表示されなくなり、ユーザーはドキュメントを正常に処理できるようになりました。

3.30.22

  • 互換性のある Bot エージェント バージョン: 21.252 以降
  • 互換性のある Control Room バージョン: 19223 以降
最新情報
Document Automationは、新しい [ドキュメント データの取得] と [ドキュメント データの更新] アクションを通して、改良された抽出を提供します。 これらのアクションを使用して、データ操作と検証のためのカスタム ロジックを適用すると、手作業による検証作業を削減することができます。

3.30.21

  • 互換性のある Bot エージェント バージョン: 21.98 以降
  • 互換性のある Control Room バージョン: 15345 以降
修正
このドキュメント抽出パッケージ リリースは、\'501:を修正するためのパッチです。 DOCUMENT_PARTIALLY_FAILED\' 」エラーがいくつかのドキュメントを処理中に発生しました。

3.30.19

  • 互換性のある Bot エージェント バージョン: 21.98 以降
  • 互換性のある Control Room バージョン: 15345 以降
修正
ドキュメント抽出パッケージは、複雑なテーブル ヘッダー列を抽出する機能を改善しました。
  • シナリオ 1: 複数のヘッダーが 1 つの列にマージされたテーブルの列ヘッダーからデータを抽出する。
  • シナリオ 2: 複数に分割されたサブヘッダーを持つテーブルの列ヘッダーからデータを抽出する。
次の手順に従って、テーブル ヘッダーのデータ抽出を改善できるようにします。
  1. ラーニングインスタンスを作成するか編集します。
  2. テーブル フィールドを追加または編集するには、[テーブル フィールド] タブに移動し、[フィールドを追加] > [フィールドのプロパティ] をクリックします。
  3. 各テーブル ヘッダーを別々のテーブル フィールドとして追加します。 例:

    シナリオ 1: 列ヘッダーと、マージされた各サブヘッダーを別々のテーブル フィールドとして追加します。 スクリーンショットを参考にして、3 つのマージされた列ヘッダー フィールドからデータを抽出し、3 つの個別のテーブル フィールド (エイリアス CGST を持つ CGST、エイリアス SGST を持つ SGST、エイリアス CESS を持つ CESS など) を作成します。

    複数のサブヘッダーを持つ列ヘッダーの例。

    シナリオ 2: 列ヘッダーと、分割された各サブヘッダーを別々のテーブル フィールドとして追加します。 上記の例と同様に、列ヘッダー CGST に分割されたサブヘッダー Rate と AMT がある場合、エイリアス CGST Rate を持つ CGST Rate テーブル フィールドと、エイリアス CGST AMT を持つ CGST AMT テーブル フィールドの 2 つを作成する必要があります。

    複数の分割サブヘッダーを持つ列ヘッダーの例。

  4. [送信] をクリックして、更新内容を保存します。

3.29.17

  • 互換性のある Bot エージェント バージョン: 21.98 以降
  • 互換性のある Control Room バージョン: 15345 以降
修正
ドキュメント抽出パッケージで、フォーム フィールドとテーブル フィールドの両方に対して抽出機能の修正が行われました。

3.29.14

  • 互換性のある Bot エージェント バージョン: 21.98 以降
  • 互換性のある Control Room バージョン: 15345 以降
最新情報
Document Automationでは、テーブルが複数あるといった複雑なシナリオに焦点を当てた発見的フィードバックによる向上した抽出機能を提供します。 さらに、抽出機能には、フォーム フィールドと初期状態のパフォーマンスの両方について (特にテーブル フィールドの抽出) に改良が加えられています。