为了提高灵活性,用户可以手动评估每个输出。

过程

  1. 评估可以从两个入口点开始。
    • 从 AI 评估页面,选择运行评估
    • 从 AI 技能页面,选择评估 > 运行评估。 这将自动填充下一步。
    您已被导航到一个新页面以配置评估。
  2. 请选择要评估的技能。
  3. 单击下一步
  4. 请选择手动评估方法,为每个输出输入您的判断。
  5. 添加您的数据集
    • 选择上传文件,输入名称并选择要在评估中使用的文件。 文件应为 CSV 格式,最大大小为 100 KB。
    • 选择 使用现有数据 以选择之前已上传的数据集。
    • 选择手动输入数据,为此配置命名并输入变量及预期输出。
  6. 单击运行评估
    评估会保存您的数据并开始运行。 处理可能需要一些时间,具体取决于评估中数据的大小。 完成后,将向您发送通知,其中包含评估的链接。
  7. 通过评估选项卡导航至评估,或单击通知中的链接。
  8. 对于每个输出,单击“点赞”或“点踩”以评估其表现。
    评估会跟踪这些判断,以在完成后提供总体分数。
  9. 完成评估后,您可以通过从评估页面导航到该评估来查看这些结果。