Anthropic モデルを使用してデータを抽出する

AWS および GCP を介して利用可能な Anthropic 生成 AI を使用して、Document Automationでデータを抽出できます。この Anthropic オプションは、v.33 以降のリリースで使用できます。

前提条件

デフォルトでは、Anthropic 用の追加の設定は必要ありません。 データ抽出は、AWS で利用可能な オートメーション・エニウェア サービス アカウントを使用して動作します。ただし、各自のアカウントを使用する場合は、Anthropic 用に設定したクラウド プロバイダーに応じて次のタスクを実行していることを確認してください。

Anthropic は、以下のメリットを提供します。

  • 大規模な非構造化ドキュメントを効率的に処理する
  • 英語と他の言語の両方でドキュメントを処理します
  • データ抽出の精度が向上し、ドキュメントの処理が高速化します
  • BYOL (Bring Your Own License) モデルを使用して、独自のライセンスを柔軟に使用できます。
注: データ抽出には、Anthropic Claude 3.0 以降のモデルを使用することをお勧めします。

手順

  1. [オートメーション] > [Document Workspace Processes] に移動します。
  2. ラーニングインスタンスと同じ名前のフォルダーをクリックします。たとえば、ラーニングインスタンス名が Residential Lease である場合、フォルダー名は Residential Lease になります。
  3. <li_name>_extractionbot をクリックします。
  4. Bot エディターで、[データの抽出] アクションを選択します。
  5. [追加の設定] オプションで [Anthropic] を選択します。
  6. Anthropic に設定したクラウド プロバイダーに応じて、次のいずれかのオプションを使用し ます。
    • AWS Bedrock
      1. [アクセス キー] オプションで、認証に必要なユーザーに関連付けられた一意の ID を入力します。

        アクセス キーは、認証のユーザー名として使用されます。[資格情報]、[変数]、[安全でない文字列] オプションを使ってアクセス キーを入力します。

      2. [Secret access key (シークレット アクセス キー)] オプションに、認証に必要なアクセス キーに関連付けられたシークレット文字列を入力します。

        シークレット アクセス キーは、認証のパスワードとして使用されます。[資格情報]、[変数]、[安全でない文字列] オプションを使ってシークレット アクセス キーを入力します。

      3. [Session token (セッション トークン)] オプションに、サービスへの一時的なアクセスを提供する短期セキュリティ資格情報を入力します。

        これはオプションの構成であり、ユーザーが期間限定でアクセスできるようにしたい場合にのみ必要です。[資格情報]、[変数]、[安全でない文字列] オプションを使ってセッション トークンを入力します。

        注: セッション トークン オプションを使用している場合は、ドキュメントを中断やエラーなく処理するために、トークンが更新されるたびにこのトークンを更新するようにしてください。
    • GCP Vertex AI
      1. [サービス アカウント キー] オプションに、GCP サービスでの認証に使用する資格情報を入力します。

        [資格情報]、[変数]、[安全でない文字列] オプションを使ってサービス アカウント キーを入力します。「サービス アカウントの作成」を参照してください。

        注: Google はセキュリティ上の理由から、一定の間隔でサービス アカウント キー内のプライベート キーの値を更新します。ドキュメントを中断やエラーなく処理するために、プライベート キーの値が更新されるたびにこの値を更新するようにしてください。
      2. [Endpoint URL for Claude model (Claude モデルのエンドポイント URL)] オプションに Anthropic モデルを指定し、Google Vertex AI エンドポイントに要求を送信するための URL を入力します。

        たとえば、https://{gcp-region}-aiplatform.googleapis.com/v1/projects/{project-id}/locations/{deployment-region}/publishers/anthropic/models/{model-ID}:RawPredict です。「Anthropic の Claude 3 モデルの使用」を参照してください。

    注: Anthropic 設定が正しく設定されていることを確認します。正しくない場合は、ドキュメントがラーニングインスタンスで処理されるときにエラーが表示されます。
Anthropic モデルを使用するように BYOL を設定したので、ラーニングインスタンスを使用してドキュメントを処理してデータを抽出できます。