Automation 360

Anthropic: 多模态人工智能 action

Download as PDF

Table of Contents

Anthropic: 多模态人工智能 action

Download as PDF

Updated: 2026/03/02

Anthropic: 多模态人工智能 action

Anthropic：多模态人工智能 action 将您的自动化连接到 Amazon Bedrock Anthropic 的 Claude 3 模型，这些模型可以处理复杂任务，例如描述作为输入提供的图像内容。

先决条件

您必须拥有机器人创造程序角色才能使用 Anthropic：在机器人中进行多模态人工智能操作。
确保您拥有发送请求所需的凭据。有关获取凭据的详细信息，请参阅 Amazon Bedrock: 身份验证 action。

此示例展示了如何向 Claude 3 模型发送特定图像并提出针对性问题，从而根据内容生成相关答案。

过程

在 Control Room 中，导航到操作窗格，选择生成式人工智能 > Amazon Bedrock，拖动 Anthropic：多模态人工智能，并将其放置在画布中。
输入或选择以下字段：
1. 输入区域。有关区域的信息，请参阅 Amazon Bedrock GA 区域。
2. 从模型下拉菜单中选择一个大型语言模型 (LLM) 来使用您的提示。可以选择以下模型：
  - Claude 3 Sonnet v1
  - Claude 3 Haiku v1
  - 其他支持的版本：其他受支持的版本选项允许您输入由 Amazon Bedrock 支持的任何 Anthropic Claude 模型的模型 ID，该模型的请求和响应格式与 Claude 3 模型一致。有关支持的请求和响应架构的详细信息，请参阅 Amazon Bedrock 文档，以了解 Anthropic Claude 模型。
  在此示例中，选择了 Claude 3 Sonnet v1。
3. 输入一个提示，以便模型生成响应。
4. 最多上传五张图片。此示例展示了一张在草地上有三只狗的图片。要上传图像，请执行以下操作之一：
  - 选择图像链接并输入图像网址或
  - 选择上传图像，通过文件流（参见使用文件变量进行文件流式传输）、Control Room 文件或桌面文件上传图像。
5. 选择是以上传多个图像。您最多可以上传五张图片。
6. 输入最大长度。
  默认情况下，如果您不输入值，则最大长度会自动设置，以确保在考虑生成响应的长度后，将其保持在所选模型的最大上下文长度范围内。
7. 输入温度。该值指的是响应的随机性。当温度接近零时，响应变得具体。值越高，响应就越随机。
8. 输入会话名称以将会话限制为当前会话。使用与身份验证操作中相同的名称。
9. 要管理可选参数，请单击显示更多选项并选择是。如果您选择是，您可以添加其他参数，例如：系统提示、Top P、Top K、添加指令、停止序列，或输入 Anthropic 版本。有关这些可选参数的信息，请参阅学习模型。
  
  注： Claude 3 模型接受系统提示。与传统指令不同，系统提示提供了一种结构化的方法来引导 Claude 3。这是因为 Claude 3 经过训练，能够理解您提示背后的意图，并生成满足该目标的相应，而不仅仅是简单地遵循一系列命令。
10. 将响应保存到变量。
  在此示例中，响应被保存到 multiModalResponse。
单击运行启动 bot。
您可以通过在消息框 action 中打印响应来读取字段的值。在此示例中，multiModalResponse 打印响应。

当以下图像与提示一起作为输入提供时，生成的响应显示在下表中：


提示	响应
解释图像	图片显示三只可爱的幼犬在户外的草地上一起奔跑。他们似乎是牧羊犬品种，可能是澳大利亚牧羊犬或类似品种。它们的毛色是黑色、白色和棕褐色的混合。小狗们有着耷拉的耳朵，充满活力，在开阔的空间中奔跑，嬉戏的瞬间被捕捉下来。背景略微模糊，使得人们的注意力集中在前景中活泼快乐的小狗上。这幅图传达了一种快乐、青春的感觉，以及与顽皮的小狗有关的纯粹乐趣。