手动运行 AI 评估
- Updated: 2025/12/01
为了提高灵活性,用户可以手动评估每个输出。
过程
-
评估可以从两个入口点开始。
- 从 AI 评估页面,选择运行评估。
- 从 AI 技能页面,选择评估 > 运行评估。 这将自动填充下一步。
您已被导航到一个新页面以配置评估。 - 请选择要评估的技能。
- 单击下一步。
- 请选择手动评估方法,为每个输出输入您的判断。
-
添加您的数据集
- 选择上传文件,输入名称并选择要在评估中使用的文件。 文件应为 CSV 格式,最大大小为 100 KB。
- 选择 使用现有数据 以选择之前已上传的数据集。
- 选择手动输入数据,为此配置命名并输入变量及预期输出。
-
单击运行评估。
评估会保存您的数据并开始运行。 处理可能需要一些时间,具体取决于评估中数据的大小。 完成后,将向您发送通知,其中包含评估的链接。
- 通过评估选项卡导航至评估,或单击通知中的链接。
-
对于每个输出,单击“点赞”或“点踩”以评估其表现。
评估会跟踪这些判断,以在完成后提供总体分数。
- 完成评估后,您可以通过从评估页面导航到该评估来查看这些结果。