El método más rápido para realizar una evaluación es haciéndolo automáticamente. Esto aprovecha el modelo de lenguaje extenso (LLM) como juez para comparar datos, en lugar del esfuerzo humano.

Procedimiento

  1. Las evaluaciones se pueden iniciar desde dos puntos de entrada.
    • En la página Evaluaciones de IA, seleccione Ejecutar evaluación.
    • En la página Habilidades de IA, seleccione Evaluar > Ejecutar evaluación. Esto completará automáticamente el siguiente paso.
    Se le redirigirá a una nueva página para configurar la evaluación.
  2. Seleccione la habilidad que desea evaluar.
  3. Haga clic en Siguiente.
  4. Seleccione el método Evaluar automáticamente para usar el LLM como juez y métricas de procesamiento de lenguaje natural (NLP) en la evaluación.
  5. Agregue su conjunto de datos
    • Seleccione Cargar archivo para ingresar un nombre y elegir el archivo que se usará en la evaluación. El archivo debe estar en formato CSV con un tamaño máximo de 100 kb.
    • Seleccione Utilizar datos existentes para elegir un conjunto de datos que ya se haya cargado previamente.
    • Seleccione Ingresar datos manualmente para proporcionar un nombre y crear un conjunto de datos de forma manual, ingresando variables de entrada y salidas esperadas opcionales.
  6. Haga clic en Ejecutar evaluación.
    La evaluación guarda sus datos y comienza a ejecutarse. El procesamiento puede tomar algún tiempo, dependiendo del tamaño de los datos de la evaluación. Al finalizar, se le envía una notificación que incluye un enlace a la evaluación.
  7. Acceda a los resultados a través de la pestaña Evaluación o haciendo clic en el vínculo de la notificación.