Generative AI 機能を持つDocument Automationのアーキテクチャとセキュリティのガイドライン

これは、Generative AI 機能を持つDocument Automationを使用する場合の考慮事項として、個人情報保護、セキュリティ、一般的な事例をリスト化したものです。

機能

注: 生成 AI モデルは、誤りを生み出したり、生成した情報を誤って伝えたりすることがあります。AI モデルによって生成されたコンテンツの正確性、信頼性、および完全性を検証することをお勧めします。
Document Automationが非構造化ドキュメントや出荷ドキュメントを処理する方法は、請求書と比較して何が違うのですか?
Automation Anywhere は、Document Automation製品に (個別にモデル化された) 大規模言語モデル (LLM) を採用し、非構造化ドキュメントや出荷ドキュメントの処理を支援します。
Generative AI を使って処理できるドキュメント タイプは?
請求書、船荷証券、貨物運送状、到着通知、梱包リストなど、事前トレーニング済みのドキュメント タイプを含む、あらゆる非構造化および半構造化ドキュメント。
Document Automationでサポートされるフィールド タイプに制限はありますか?
いいえ、GenAI 機能を持つフォーム フィールドとテーブル フィールドをサポートしています。
サポートされている言語は?
公式には英語がサポートされていますが、他の言語も使用できます。
Generative AI 機能付きDocument Automationの価格体系はどうなっていますか?
Automation AnywhereDocument Automationの 1 ページあたりの料金で、OpenAI の費用は料金に含まれています。
お客様は Microsoft Azure OpenAI LLM 向けの独自の Azure エンドポイントを呼び出すことができますか?
はい、Microsoft Azure OpenAI の BYOL (Bring Your Own License) や、お客様が定義した LLM エンドポイントの事例をサポートしています。
Document Automation機能付きのGenerative AI は、顧客のプライベート クラウドのOn-Premisesで利用できますか?
はい、Document AutomationOn-PremisesバージョンとCloud バージョンで、統合されたgenerative AI を使用できるようになりました。
非構造化ドキュメント タイプには、どのような OCR エンジンを使用できますか?
現在、Google Vision OCR と ABBYY OCR をサポートしています。
出荷ドキュメントに使用できる OCR エンジンは何ですか?
出荷ドキュメントには ABBYY OCRGoogle Vision OCR を使用することをお勧めします。

セキュリティ

Document Automationは、どの LLM にクエリを送るのですか?
Document Automationは、現在、LLM 用の Microsoft Azure OpenAI サービスと Anthropic を使用しています。Microsoft Azure OpenAI は、現在 GPT3.5-Turbo と OpenAI ADA モデルを使用しています。
Document Automation ドキュメントは処理するために、どの国に送信されるのですか?
Automation Anywhere は、処理のために EU と米国の地域を選択します。
Automation Anywhere は、Document Automationに送信されたドキュメントのデータで LLM をトレーニングすることをベンダーに許可していますか?
いいえ。Automation Anywhere は、お客様やユーザーから提出されたドキュメントやデータをトレーニング目的で使用したり、サードパーティ ベンダーに使用を許可したりすることはありません。
Automation Anywhere は、Document Automationに送信されたドキュメントのデータで、自身の LLM のインスタンスをトレーニングしますか?
いいえ。Automation Anywhere は、お客様やユーザーから提出されたドキュメントやデータをトレーニング目的で使用したり、サードパーティ ベンダーに使用を許可したりすることはありません。
お客様がDocument Automationに提出するプロンプトやドキュメントにアクセスできるその他のベンダーはありますか?
はい、お客様がDocument Automationに提出するデータにアクセスできるベンダーのリストについては、当社の DPA の「付録 C」(この段落の最後にあるリンク) をご覧ください。該当するベンダーは、該当するサービスと書かれた 2 番目の欄に「Document Automation」と表示されます。DPA へのリンク。
Automation Anywhere は、Document Automationに提出されたドキュメントや、ドキュメントから抽出されたデータを保存しますか?
Automation Anywhere Cloud ホスティング プロバイダーの他に、Automation Anywhere ベンダーはいかなるドキュメントも保存しません。ドキュメントは、一時的な状態でのみ存在します。しかし、お客様がドキュメントを検証できるようにするために、Automation Anywhere はドキュメント画像とドキュメント テキストの OCR 出力をCloud インスタンスに格納します。
どのようなデータが LLM サービスと共有されるのですか?
ドキュメント、ドキュメントのコンテンツ、プロンプトまたは検索クエリです。
Automation Anywhere は、顧客がDocument Automationに送信する PHI について、保護医療情報 (C.F.R. § 160.103 で定義) (PHI) の処理に関する Business Associate Agreement (BAA) を締結しますか?
はい。通常、当社の BAA は、当社の Cloud Automation 契約に自動的に組み込まれます。カスタマー サクセス マネージャー (CSM) またはセールス エグゼクティブ (SE) に連絡して、BAA が締結されているかどうかをご確認ください。締結されていない場合、CSM または SE が、お客様に BAA のコピーを提供します。
Automation Anywhere は、お客様がDocument Automationに提出する個人データの処理について、データ処理契約 (「DPA」) を締結しますか?
はい。通常、当社の DPA は、当社の Cloud Automation 契約に自動的に組み込まれます。カスタマー サクセス マネージャー (CSM) またはセールス エグゼクティブ (SE) に連絡して、DPA が締結されているかどうかをご確認ください。締結されていない場合、CSM または SE が、お客様に DPA の署名済みコピーを提供します。当社の DPA の条項をご覧になりたい場合は、こちらをご覧ください。オートメーション・エニウェア DPA 契約
Google Vision OCR サービスからの重要なデータ使用の詳細 (ソース: Google)。
Google Vision OCR サービスのデータの使用

アーキテクチャ図

GenAI ソリューション アーキテクチャを持つ Document Automation

抽出プロセスはいくつかのステップで構成され、CloudOn-Premisesのデプロイに適用できます。
  1. 認証:
    • 抽出プロセスは、Bot Runner デバイス上でドキュメント抽出パッケージを実行することで開始します。
    • (1) 抽出プロセスの構成はラーニングインスタンスで定義されます。ラーニングインスタンスが Generative AI 方式の抽出を使用する場合、パッケージは Control Room に接続してプロキシ ゲートウェイのホスト ロケーションと認証トークンに関する情報を取得します。
  2. OCR:
    • 次のステップでは、ドキュメントからテキスト レイヤーを取得します。システムは、タスクのために OCR エンジンを使用します。デフォルトでは、システムは ABBYY OCR を使用します。
    • (2) ABBYY OCR または Google Vision OCR のいずれかを選択できます。
      • ラーニングインスタンスで ABBYY OCR が選択されている場合、パッケージは、処理のために ABBYY OCR がデプロイされている Bot Runner マシンにドキュメントを送信し、その結果がパッケージに返送されます。
      • ラーニングインスタンスで Google Vision OCR が選択された場合、パッケージはプロキシ ゲートウェイにドキュメントを送信します。
    • (3) プロキシ ゲートウェイは、このリクエストを OCR のために Google Vision API のエンドポイントに転送し、(4) 結果をパッケージに送り返します。
  3. データ抽出:
    • (5)(6)(7) 大規模なドキュメントを処理するために、パッケージは ADA モデルを用いて、ドキュメントの様々なチャンクの埋め込みを作成します。
    • (8)(9) 次に、パッケージは埋め込みを使用して、提供された検索クエリ (複数可) に最も関連するドキュメントのチャンクを特定し、そのチャンクをプロキシ ゲートウェイを通して GPT モデルにプロンプトと共に送信します。
    • (10) 最後に、パッケージは GPT からの応答を受け取り、それをドキュメント抽出結果に変換します。

Automation Anywhere Cloud Generative AI のデータ セキュリティ情報については、こちらをご覧ください。生成 AI のためのデータ セキュリティ - よくある質問