Cree una instancia de aprendizaje en Community Edition

Cree una instancia de aprendizaje para comenzar a procesar documentos. En Community Edition, puede extraer datos de los tipos de documentos y los idiomas compatibles utilizando el proveedor de OCR ABBYY.

Procedimiento

  1. From the Control Room home page, navigate to IA > Document Automation , and click Create Learning Instance.
  2. Enter a name and description for the learning instance.
    Automatización de documentos does not allow duplicate learning instance names, so the name you provide must be unique.
  3. Seleccione un tipo de documento adecuado.
    Nota: Use el tipo de documento Definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
  4. Seleccionar el idioma.
  5. Opcional: Puede utilizar la opción Mejorar la precisión mediante la validación para enviar comentarios al sistema con el fin de mejorar los resultados de extracción. Para obtener más información, consulte Mejorar la precisión de la extracción mediante la validación.
  6. Opcional: Seleccione la opción Extracción de datos impulsada por IA generativa para utilizar las funciones de IA generativa para la extracción. Para obtener más información, consulte Extracción de datos en Automatización de documentos mediante IA generativa.

    Los proveedores de IA generativa ofrecen las siguientes ventajas:

    • Procesar de manera eficiente los documentos grandes y no estructurados.
    • Puede manejar documentos tanto en inglés como en otros idiomas.
    Seleccione uno de los siguientes proveedores de IA generativa:
    Nota:
    • Al hacer una actualización desde una versión anterior a v.38 o posterior, Open AI se configurará como el proveedor de extracción de datos predeterminado.
    • Si procesó documentos usando OpenAI y, luego, cambió a Anthropic para la extracción de datos, solo los documentos que se procesarán después de cambiar a Anthropic utilizarán Anthropic para la extracción de datos. En el caso de los documentos procesados previamente, los datos extraídos utilizarían Azure OpenAI.
    • Open AI: se utiliza el modelo Azure OpenAI para la extracción de datos. Este proveedor está disponible mediante licencia integrada (no requiere licencias adicionales) y del modelo traiga su propia licencia (BYOL).

      Si está utilizando BYOL, asegúrese de establecer la configuración adicional para OpenAI en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.

    • Anthropic: Ahora puede usar los modelos disponibles de Anthropic en IA generativa a través de AWS y GCP para la extracción de datos en Automatización de documentos. Esta oferta le brinda flexibilidad para seleccionar el modelo de IA generativa según el proveedor de Nube que su empresa haya certificado.

      Si usa el método traiga su propia licencia (BYOL), debe configurar el modelo de Claude de Anthropic en el servicio Google Vertex AI o Amazon Bedrock y, luego, establecer la configuración adicional en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.

  7. Click Next.

We recommend that you open a sample document side by side with the Control Room window as you configure the form and table fields.

Nota:
  • A form field is a type of field that occurs only one time in a document.
  • A table field is a type of field that reoccurs throughout a document, typically in the form of a table.

  1. Configure the form and table fields for extraction. For more details, see Ver y buscar campos.
    1. Click a field to open the fields editor. For more details, see .Directrices para editar los campos y crear alias personalizados
    2. Hover over the menu icon to the right of a field to access the up/down arrows.
    3. Use the arrows to rearrange the order of the fields for a more efficient manual validation.
      The order of the fields does not impact extraction.
    To learn more about the other field attributes, see Consideraciones sobre los campos de formularios y tablas.
  2. Click Add a field and specify the fields details such as field name, fields label, confidence, data type, format date/number, and so on. For more details, see Consideraciones sobre los campos de formularios y tablas.
    Nota: If you have selected the Generative AI-driven data extraction option, we recommend that you add good prompts for fields to get the expected results when you create the learning instances. See Extracción de datos en Automatización de documentos mediante IA generativa.
    The following image shows form and table fields configured in a learning instance:
    Form fields of a learning instance

    Table fields of a learning instance and adding custom table at learning instance level
    Nota: The Add a field option is not available for Receipts document type.
  3. Click Create.

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Community Edition