Hugging Face: Serverless Inference 操作

该主题介绍如何使用 Hugging Face: Serverless Inference 操作并利用 Hugging Face 模型的强大功能来处理各种 NLP 任务。

先决条件

注: 本页面提供的示例和图形仅用于表示目的,可能无法准确反映您的具体情况。 我们不对其维护或准确性承担责任。
  • 您必须拥有 Bot Creator 角色才能在机器人中使用 Hugging Face: Authentication 操作。
  • 创建 Hugging Face 账户。 您可以在此创建一个账户创建 Hugging Face 账户
  • 确保您拥有发送请求所需的凭据,并在调用 Hugging Face:Serverless Inference Hugging Face: 身份验证操作 之前包含 action

过程

  1. 登录到您的 Hugging Face 账户。
  2. 选择模型: 导航到 Hugging Face 模型库(Hugging Face 模型)。搜索并选择支持 Serverless Inference 的模型。 支持的模型类型包括:
    1. 文本生成
    2. 文本转图像生成
    3. 图像转文本生成
    4. 文本转音频生成
    在此示例中,使用 openai-community/gpt2 模型进行文本生成
  3. 从模型的 Serverless Inference 请求格式中复制以下内容。
    1. 模型 ID: 从请求格式的 API URL 中复制模型 ID。 在这种情况下,为 openai-community/gpt2
    2. 请求负载: 使用模型的 Serverless Inference 格式中提供的 JSON。

      Hugging Face 请求格式
      在 JSON 中修改提示以适应您的特定用例。 例如:您可以按如下方式修改上述 JSON:
      {"inputs": "用简单的语言解释量子计算。"}

      观看以下视频,了解如何访问上述模型的请求格式。

  4. 登录到 Control Room
  5. 操作窗格中,选择AI > Hugging Face > Serverless Inference,并将其放置在画布上。
  6. 输入或选择以下字段:

    Hugging Face Serverless Inference 操作
    1. 模型 ID 字段中,粘贴从您的 Hugging Face 复制的模型 ID
    2. 请求负载字段中,粘贴从您的 Hugging Face 复制的请求负载
    3. 可选: 数据文件路径: 数据文件路径指定了由您的模型生成的图像/音频文件的下载位置。
    4. 输入 默认 作为会话名称,以将会话限制为当前会话。
    5. 将响应保存到变量。 在此示例中,响应保存到 HuggingFace-response
  7. 单击运行以启动自动化。
    您可以通过在消息框 action中打印响应来读取字段的值。 在此示例中,HuggingFace-response 打印响应。
    提示: 要在同一个机器人中维护多个聊天,您需要用不同的名称或变量创建多个会话。

    上述自动化的响应如下:


    Hugging Face Serverless Inference 响应

    您可以使用 JSON 软件包解析输出 JSON,以获取所需的输出。

更多示例

以下自动化展示了使用 Hugging Face:Serverless Inference 操作执行文本转图像图像转文本文本转音频的 生成能力。 每个示例在后续部分中都有详细说明。


Hugging Face 示例

文本转图像

以下示例演示了使用 Hugging Face:Serverless Inference 操作执行文本转图像的 生成能力。


Hugging Face Automation Anywhere 文本转图像示例
注: 请提供用于保存图像的数据文件路径

图像转文本

以下示例演示了使用 Hugging Face:Serverless Inference 操作执行图像转文本的 生成能力。


Hugging Face Automation Anywhere 图像转文本示例
注: 在将图像输入模型之前,使用 Base64 Conversion >> Base64 Encode 操作将其转换为 Base64 格式。 模型需要这种格式的图像才能准确生成文本。

文字转语音

以下示例演示了使用 Hugging Face:Serverless Inference 操作执行文本转语音的 生成能力。


Hugging Face Automation Anywhere 文本转音频示例
注: 提供一个带有扩展名的数据文件路径,将请求负载中的输入提示文本转换为音频格式。