您可以使用通过 AWS 和 GCP 提供的 Anthropic 生成式 AI 模型在 文档自动化 中进行数据提取。当您使用 v.33 及更高版本时,可以使用 Anthropic 选项。

先决条件

默认情况下,Anthropic 不需要额外的配置。 数据提取将使用 AWS 中可用的 Automation Anywhere 服务账户进行。 但是,如果您想使用自己的账户,请确保已根据为 Anthropic 配置的 云部署 提供商执行了以下任务:

Anthropic 提供以下优势:

  • 高效处理大型非结构化文档
  • 处理英文和其他语言的文档
  • 更快的文档处理速度和更高的数据提取准确性
  • 通过自带许可证 (BYOL) 模式灵活使用您自己的许可证
注: 建议您使用 Anthropic Claude 3.0 或更高版本的模型进行数据提取。

过程

  1. 导航到自动化 > 文档工作区进程
  2. 单击与学习实例同名的文件夹。 例如,如果学习实例名称是 Residential Lease,那么文件夹名称将是 Residential Lease
  3. 单击 <li_name>_extractionbot
  4. 机器人编辑器 中,选择提取数据 操作
  5. 附加设置选项中,选择 Anthropic
  6. 根据您为 Anthropic 配置的 云部署 提供商,使用以下选项之一:
    • AWS Bedrock
      1. 访问密钥选项中,输入与用户关联的用于身份验证的唯一标识符。

        访问密钥用作身份验证的用户名。 使用凭据变量不安全字符串选项输入访问密钥。

      2. 秘密访问密钥选项中,输入与身份验证所需的访问密钥关联的秘密字符串。

        秘密访问密钥用作身份验证的密码。 使用凭据变量不安全字符串选项输入秘密访问密钥。

      3. (可选)在会话令牌选项中,输入一个短期有效的安全凭据,以提供对该服务的临时访问权限。

        这是一个可选配置,仅在您希望用户在有限时间内访问时才需要。 使用凭据变量不安全字符串选项输入会话令牌。

        注: 如果您使用会话令牌选项,请确保每次刷新时都更新此令牌,以便处理文档时不会出现中断或错误。
      4. Claude 模型的端点 URL 选项中,输入 URL 以指定 Anthropic 模型并向 AWS Bedrock 端点发送请求。

        例如,https://bedrock-runtime.aws-region.amazonaws.com/model/model-id/invoke。 请参阅 Amazon Bedrock endpoints and quotasAWS Bedrock model IDs

    • GCP Vertex AI
      1. 服务账户密钥选项中,输入用于向 GCP 服务进行身份验证的凭据。

        使用凭据变量不安全字符串选项输入服务账户密钥。 请参阅 Creating a service account

        注: Google 出于安全原因会在特定时间间隔刷新服务账户密钥中的私钥值。 确保每当私钥值更新时,您都要更新此值,以便处理文档时不会出现中断或错误。
      2. Claude 模型的端点 URL 选项中,输入 URL 以指定 Anthropic 模型并向 Google Vertex AI 端点发送请求。

        例如,https://gcp-region-aiplatform.googleapis.com/v1/projects/project-id/locations/deployment-region/publishers/anthropic/models/model-ID:RawPredict。 请参阅 AWS Bedrock InvokeModel examples

    注: 验证是否已正确配置 Anthropic 设置。 否则,在学习实例中处理文档时会显示错误。
现在您已配置 BYOL 以使用 Anthropic 模型,您可以使用学习实例处理文档以提取数据。