ドキュメント オートメーション v.32 リリース

v.32 リリースの ドキュメント オートメーション の最新情報と変更点、および修正と制限事項について確認してください。

ドキュメント オートメーション

最新情報
フィードバックのロック/ロック解除機能を使用した検証フィードバックの管理

[フィードバックのロック/ロック解除] 機能を使用して、ラーニングインスタンスの検証フィードバックをロックできるようになりました。 この機能を有効にすると、各ラーニングインスタンスに対してそれ以上の検証フィードバックを提供することはできません。

注: この機能は、[検証を使用して精度を改善] オプションが有効になっている場合にのみ使用できます。

検証フィードバックをロックする

ドキュメント オートメーション デプロイの クラウド オンプレミス機能
クラウド Automation 360 デプロイにオンプレミス機能を活用できるようになりました。 この機能により、オンプレミス デプロイに以下の機能を使用できます。
  • 生成 AI を使用した検索クエリ
  • Google Document AI
  • Google Vision OCR
  • 船荷証券、貨物運送状、着荷通知、梱包証明書の各ドキュメント タイプ

生成 AIへのドキュメント オートメーション およびその他の外部接続の有効化

ラーニングインスタンスでの複数のテーブルのサポートによるユーザー エクスペリエンスの向上

ドキュメント オートメーション ユーザーとして、1 つのラーニングインスタンスで複数のカスタム テーブルを作成できるようになりました。 この機能により、すべてのドキュメント タイプについて、ラーニングインスタンスの作成および編集中にカスタム テーブルを追加できます。

ドキュメント オートメーションにラーニングインスタンスを作成 | 非構造化ドキュメント向けの 生成 AI を備えたラーニングインスタンスを作成する

テーブル フィールドの GenAI によるデータ抽出機能の強化
テーブル フィールドの GenAI サポートによってもデータ抽出が拡張されました。 この機能は、本リリースから非構造化ドキュメントと半構造化ドキュメントで利用できるようになりました。 単純な自然言語クエリを使用して、テーブル データを効率的に抽出できるようになったため、ドキュメント処理はより迅速かつ正確になります。
注: この機能は、クラウドおよびオンプレミス で利用できます。

ドキュメント オートメーション - 生成 AI を使用したデータ抽出

MS OpenAI の BYOK (Bring Your Own Key: 自分のライセンスを使用する) サポート

ユーザーが自分のアカウントを使用して、ドキュメント オートメーションの機能や性能を使用しながら、アクセスを維持しデータを管理できるよう、ユーザーに BYOL オプションを提供しています。

ドキュメント抽出 > データの抽出 アクションをタスク Botで使用すると、Google Document AI またはMS OpenAI サービスを使用してドキュメントからデータを抽出できます。

Google Document AI サービスを使用する際に、独自のライセンス キーを使用するオプションがすでに用意されています。 今回のリリースより、MS OpenAI サービスを使用するために独自のライセンスと認証情報を使用するオプションが提供されます。

MS OpenAI サービスでは、ドキュメント オートメーションに接続するためのエンドポイント URL と、GPT モデルと埋め込みモデルのサービス アカウントが提供されます。

[データの抽出] アクション | ドキュメント オートメーション - 生成 AI を使用したデータ抽出

変更内容
標準フォームの韓国語サポート

に関連するロケールとともに [韓国語] がサポートされるようになりました標準フォーム。 この機能強化により、[韓国語] でドキュメントを処理し、データを抽出できます。

ドキュメント オートメーションでサポートされている言語

修正
複数のフィールド ルールを使用して、文字列内に複数回出現する文字を置き換えることができるようになりました。

従来では、最後のフィールド ルールのみが適用されていました。

Service Cloud ケース ID: 02124562

これで標準フォーム モデルを作成し、インスタンスがプロキシでセットアップされているときに、同じモデルを使ってラーニングインスタンスを作成できるようになりました。
[ラーニングインスタンス] ページで、Google Document AI プロバイダー アイコンが Google CDE ラーニングインスタンスに表示されるようになりました。
ユーザーがテーブルの複数列にわたって数式の検証を適用し、フォーム フィールド レベルで値を検証する場合 (小計など)、かつユーザーが 1 つ以上の行を削除して現在の行と一致するようにフォーム フィールドの値をリセットする場合、検証エラーは表示されなくなります。 エラー メッセージも表示されません。
Google OCR のテーブル抽出が改善され、抽出後に不必要な記号が表示されなくなり、ドキュメントが正しく抽出されるようになりました。
テーブル データを含むドキュメントを抽出する場合、テーブル抽出機能の強化によりデータが正しく抽出されます。

以前はこのような場合、ユーザーはテーブル データ抽出の問題に直面していました。

ユーザーがドキュメント タイプに英語以外の文字 (アラビア文字や中国語など) を含み、IQ Botに接続されている ドキュメント オートメーション ラーニングインスタンスに接続してドキュメントを処理する場合、そのような接続されたラーニングインスタンスの Control Room > IQBot ページ でライセンス消費量が追跡されるようになりました。
ユーザーが [パーサーの構成] ページからパーサーを削除し、後でラーニングインスタンスを作成した場合、[ドキュメント タイプ] ドロップダウンに、削除されたパーサーに関連付けられたドメインが表示されなくなりました。
パーサーを構成して、[日本語] を選択すると、[ロケール] フィールドに関連する正しいロケール (日本語 (日本)) 値が表示されます。

以前はこのような場合、[ロケール] フィールドは [英語 (米国)] 値を表示していました。

必要な事例にしたがって、ユーザーはラーニングインスタンスの作成中にフィールド・ルールを上下に移動させ、フィールド ルールの順序を問題なく変更できるようになりました。

Service Cloud ケース ID: 01996145

[ドキュメント データの更新] アクションのロジックが改善され、ユーザーは入力 JSON ファイルの複数の行を通じて提供されるすべてのテーブル データを表示できるようになりました。 これは DocumentJsonDictionaryType のドキュメント データ入力に適用できます。

以前は、このような場合、最初の行のデータのみがテーブルに入力されていました。

ボタン内のテキストは Community Edition で圧縮されて表示されなくなりました。 また、テキスト パディングがすべてのボタンで統一されるようになりました。

以前は、圧縮された外観と一貫性のないテキスト パディングが、ユーザー エクスペリエンスの悪さにつながっていました。

SIR の生成はフィードバックのたびに変化しなくなり、一貫した抽出結果が得られるようになりました。

Service Cloud ケース ID: 02107121

同じプロバイダードキュメント タイプで、言語が異なる 2 つのパーサーを作成した場合、(最初と 2 番目の) の両方のパーサーを削除できるようになりました。

以前は、このようなシナリオでパーサーを削除することはできませんでした。

制限事項
検証フィードバックは、IQ Bot から ドキュメント オートメーションIQ Bot—DA Bridge パッケージ を使用して移動された学習インスタンスに適用されていません。
クラシック ドキュメント オートメーション から [IQ Bot - DA ブリッジ] パッケージを使用して、IQ Botにインポートされたラーニングインスタンスでユーザーがドキュメントを処理する場合、クラシック ラーニングインスタンスがチェックボックス フィールドを使用して作成され、[検証を使用して精度を改善] オプションが有効になっている場合、抽出に失敗します。
ユーザーがカスタム プロセス ラーニングインスタンスでドキュメントを処理する場合、検証ドキュメント数が抽出後に更新されません。 また、ユーザーがドキュメントを送信した場合、検証ドキュメント数は負の値で更新されます。
複数テーブルを含むラーニングインスタンスでドキュメントを処理すると、検証フィードバックがどの複数テーブルに対しても機能しません。
ブリッジ ラーニングインスタンスの場合、IQ Bot でトレーニングが提供されていない場合、またはテーブル列の見出しがドキュメント オートメーションの列フィールドに正しくマッピングされていない場合、デフォルトまたはカスタムのテーブル フィールドに対して検証フィードバックが機能しません。
回避策: この問題を修正するには、次のいずれかのステップを実行します。
  • [詳細トレーニング設定] を使用して検証フィードバックを提供し、すべての空の列にヘッダーをマッピングします。 検証フィードバックは、次回以降のドキュメントに適用されます。
  • 2 回目のドキュメントの処理時に検証フィードバックを提供し、ドキュメントを送信します。 検証フィードバックは、次回以降のドキュメントに適用されます。
Control Room バージョン .31 以前を ドキュメント オートメーション パッケージ バージョン .32 と併用すると、新たに作成されたラーニングインスタンスで抽出に失敗することがありました。
回避策: エラーなしでドキュメントを処理するには、次の手順を実行します。
  1. 対応するラーニングインスタンスのリポジトリ内のプロセス フォルダーに移動します。
  2. extractionbot を編集します。
  3. [データを抽出] アクションの [追加設定] で、[なし] オプションを選択します。
  4. 変更を保存します。
以前のリリースからの制限事項

BYOK (Bring Your Own Key) 設定で Google CDE を使用してドキュメントを処理し、対応するプロセッサーが基礎モデルを使用している場合、変換の失敗によりドキュメント処理が失敗します。

回避策: この問題を解決するには、Google コンソールで基礎モデルではなくカスタム モデルを使用します。

公開プロセスでは、以下のような場合にエラー メッセージが表示されることがあります。
  • 検証キュー内のすべてのドキュメントを検証した後。
  • 同じラーニングインスタンスでいくつかのドキュメントを処理した後、最初のドキュメントを開いて、[更新] をクリックした場合。
注: 非公開プロセスでは、エラー メッセージは表示されません。
IQ Bot ラーニングインスタンスがすでに他のユーザーによってブリッジされている場合、エラー メッセージはユーザーに表示されません。
ドキュメントを処理し、検証ツールに送信すると、数値データ タイプの小数 (.78 や .99 など) の問題が発生することがあります。

回避策: この問題を解決するには、小数を 0.78 または 0.99 と入力する必要があります。