调用 SageMaker 端点操作将数据发送到部署在 SageMaker 平台上的 AI 模型,并接收响应。 此操作使您能够将机器学习功能直接集成到您的 Control Room 中,根据训练模型的专业知识进行预测或分类。

注: 本页面提供的示例和图形仅用于表示目的,可能无法准确反映您的具体情况。 我们不对其维护或准确性承担责任。

概述

调用 SageMaker 端点进程

  • 准备数据: 在调用端点之前,您需要准备好要发送进行预测的数据。 这可以是图像、文本片段、数值或模型期望的任何其他格式。
  • 调用端点: 要获取预测结果,您需要将准备好的数据作为输入,发送 POST 请求到端点 URL。 请求通常包含 JSON 格式的数据。
  • 端点处理: SageMaker 端点使用已部署的模型处理传入的数据。 它通过模型的算法运行数据,并根据模型的训练生成预测或响应。
  • 响应: 端点在 HTTP 响应体中返回模型的预测或响应。 您的应用程序可以解析此响应并根据需要使用结果。

先决条件

  • AI 模型应部署在 SageMaker 中。
  • 可以通过调用 SageMaker 端点访问已部署的模型。
注: 此任务通常由具有管理员权限的自动化管理员执行。

过程

  1. 登录到您的 AWS 控制台并选择项目。
  2. 单击与您选择的项目对应的管理控制台AWS SageMaker 管理控制台
  3. 搜索 SageMaker 并选择 Amazon SageMakerAWS SageMaker 搜索
  4. 导航到并单击一个域。AWS SageMaker 域或者,您可以单击 Studio(左侧导航中),选择适当的域,然后单击打开 Studio。 要添加域,请参阅 AWS add a custom domain。 有关域的详细信息,请参阅 Amazon SageMaker Domain
  5. 导航到 推理 > 端点,查看所有已部署的现有模型。
    以下示例描述了如何调用已在 AWS SageMaker 上部署的文本和图像模型。