Anthropic: 多模态人工智能 操作

Anthropic: 多模态人工智能 操作 将您的自动化连接到 Amazon Bedrock Anthropic 的 Claude 3 模型,这些模型可以处理复杂任务,例如描述作为输入提供的图像内容。

先决条件

  • 您必须拥有机器人创造程序角色才能使用 Anthropic: 在机器人中进行多模态人工智能操作。
  • 确保您拥有发送请求所需的凭据。 有关获取凭据的详细信息,请参阅 Amazon Bedrock: 身份验证 操作

此示例展示了如何向 Claude 3 模型发送特定图像并提出针对性问题,从而根据内容生成相关答案。

过程

  1. Control Room 中,导航到操作窗格,选择生成式人工智能 > Amazon Bedrock,拖动 Anthropic: 多模态人工智能,并将其放置在画布中。
  2. 输入或选择以下字段:

    Anthropic-多模态

    1. 输入区域。 有关区域的信息,请参阅 Amazon Bedrock GA 区域
    2. 模型下拉菜单中选择一个大型语言模型 (LLM) 来使用您的提示。 可以选择以下模型:
      • Claude 3 Sonnet v1
      • Claude 3 Haiku v1
      • 输入其他支持的版本以选择其他支持的模型。
      在此示例中,选择了 Claude 3 Sonnet v1
    3. 输入一个提示,以便模型生成响应。
    4. 最多上传五张图片。 此示例展示了一张在草地上有三只狗的图片。
    5. 选择以上传多张图片。 您最多可以上传五张图片。
    6. 输入最大长度
      默认情况下,如果您不输入值,则最大长度会自动设置,以确保在考虑生成响应的长度后,将其保持在所选模型的最大上下文长度范围内。
    7. 输入温度。 该值指的是响应的随机性。 当温度接近零时,响应变得具体。 值越高,响应就越随机。
    8. 输入会话名称以将会话限制为当前会话。 使用与身份验证操作中相同的名称。
    9. 要管理可选参数,请单击显示更多选项并选择。 如果您选择,您可以添加其他参数,例如: 系统提示Top PTop K添加指令停止序列,或输入 Anthropic 版本。 有关这些可选参数的信息,请参阅 学习模型
      注: Claude 3 模型接受系统提示。 与传统指令不同,系统提示提供了一种结构化的方法来引导 Claude 3。 这是因为 Claude 3 经过训练,能够理解您提示背后的意图,并生成满足该目标的相应,而不仅仅是简单地遵循一系列命令。
    10. 将响应保存到变量。
      在此示例中,响应被保存到 multiModalResponse
  3. 单击运行启动 机器人
    您可以通过在消息框 操作 中打印响应来读取字段的值。 在此示例中,multiModalResponse 打印响应。

当以下图像与提示一起作为输入提供时,生成的响应显示在下表中:

提示 响应
解释图像

提示图像 - 草地上的狗

图片显示三只可爱的幼犬在户外的草地上一起奔跑。 他们似乎是牧羊犬品种,可能是澳大利亚牧羊犬或类似品种。 它们的毛色是黑色、白色和棕褐色的混合。 小狗们有着耷拉的耳朵,充满活力,在开阔的空间中奔跑,嬉戏的瞬间被捕捉下来。 背景略微模糊,使得人们的注意力集中在前景中活泼快乐的小狗上。 这幅图传达了一种快乐、青春的感觉,以及与顽皮的小狗有关的纯粹乐趣。