ラーニングインスタンスにおけるサードパーティ パーサーの統合

ドキュメント オートメーションでは、カスタムの Automation 360 パッケージを使用することで、外部抽出エンジンに接続することができます。このカスタム パッケージをパーサーとして作成、カスタマイズ、接続し、それを使ってドキュメントを抽出することができます。

カスタム パッケージは、API を使用して、OpenAI、Amazon、Google などローカル エンジンおよび外部サービスを活用します。

ドキュメント オートメーションのサードパーティ パーサー統合機能を使えば、カスタム Automation 360 パッケージを作成してドキュメント オートメーションに接続し、それをパーサーとして使ってドキュメントを処理することができます。特定の事例に基づいて独自のパーサーを作成し、それをラーニングインスタンスと統合してドキュメントを処理します。ラーニングインスタンス内でサードパーティ パーサーが統合されるため、関連するパッケージは、エンジンの承認済みデータ形式にドキュメント データを変換します。これが、ドキュメントを処理するためにドキュメント オートメーションに送られます。パーサーを作成または更新する際にフィールドをカスタマイズでき、ラーニングインスタンスに追加されたフィールドを表示したり、ラーニングインスタンスを作成する際にフィールドを選択またはクリアしたりすることができます。

次の図は、ドキュメント オートメーションにおけるサードパーティ パーサーの統合のフローを示しています。Document Automation におけるサードパーティ パーサーの統合

ドキュメント オートメーションでサードパーティ パーサーを統合することで、次のことが可能になります。
  • Automation 360 パッケージを活用してドキュメント抽出を強化する
  • カスタムおよびパッケージを活用したドキュメント抽出で処理時間を短縮する
  • ドキュメント解析の品質と信頼性を向上する
  • ラーニングインスタンスの効率を高め、より多くの非構造化ドキュメントを処理する
  • より少ない時間とコストでより効率的にドキュメントを抽出する

たとえば、銀行員が、新規口座開設の申請フォームのデータを検証したいとします。既存のシステム パーサーは、新しい申請ドキュメントのタイプをサポートしていません。その結果、オートメーション開発者 (プロの開発者または CoE リード) は、新規口座申請フォームからドキュメント データを抽出するために、サードパーティのパーサーを必要とします。このサードパーティのパーサーをラーニングインスタンスに統合することで、銀行員はドキュメント オートメーション SDK (ソフトウェア開発キット) を使用して、新規口座申請フォームからデータを抽出することができます。

次の図では、ビジネス ユーザー、プロの開発者、CoE リード、および Control Room 管理者のパーサー統合ワークフローを示しています。

DA パーサー ペルソナ フローの例

サードパーティ パーサーを統合するには、次の手順に従っいます。
  1. カスタム パッケージを作成し、それを Control Room にアップロードし、アップロードしたパッケージをテストします。
    カスタム パッケージのビルドとテスト」を参照してください。
    注: カスタム パーサーについて API URL 信頼済みリストを取り扱う場合は、パーサーで使用されるすべての API エンド ポイントを Bot Runner 末尾の信頼済みリストに追加する必要があります。
  2. 資格情報とロッカーCredential Vault 内に作成します。を参照してください
  3. パーサーを作成し、ドキュメント オートメーション内のラーニングインスタンスでこれを構成します。

    パーサーの作成とラーニングインスタンスの構成

  4. サードパーティ パーサーでドキュメントを処理します。

    ドキュメント オートメーション でのドキュメントの処理