Usar motor API de Google Vision de OCR

Utilice el motor de API de Google Vision OCR con IQ Bot para mejorar la precisión de los resultados de reconocimiento óptico de caracteres (OCR) para documentos de entrenamiento en idiomas asiáticos, particularmente, en japonés y coreano. El motor API de Google Vision OCR en IQ Bot admite todos los idiomas admitidos por el motor.

Antes de empezar

Verifique que el puerto predeterminado 443 esté disponible para habilitar la comunicación para el punto final de API mediante TCP.

Nota: Consulte una lista de URL de servicio permitidas para usar API de Google Vision en la sección de ejemplo a continuación.
API de Google Vision se instalan automáticamente en su máquina durante la instalación IQ Bot y se proporcionan como un complemento incorporado, con una instalación de un solo paso, y están disponibles para todos los usuarios:
  • Es un motor de nube OCR.
  • API de Google Vision no admite documentos con más de un idioma. Antes de usar esta función, asegúrese de querer extraer principalmente solo texto en japonés y coreano.
  • Los idiomas que se escriben de derecha a izquierda, en lugar de izquierda a derecha, no son compatibles con IQ Bot. Por ejemplo: árabe, arameo, azerí, divehi, fula, hebreo, kurdo, n'ko, persa, rohingya, siríaco y urdu.

    Antes de esta versión, el motor admitía principalmente la extracción de datos para texto japonés y coreano únicamente.

    Idiomas admitidos en Automation 360 IQ Bot

  • Los datos no se almacenan en Google Cloud y se eliminan de inmediato.

    Para obtener información adicional sobre la privacidad para la retención de datos, consulte: Google Data Usage

IQ Bot le proporciona la licencia para usar el motor API de Google Vision OCR. También puede utilizar su propia clave de licencia.

Use sus propias claves de licencia para el motor OCR de API de Google Vision

Nota: Las actualizaciones de API de Google Vision como mejoras del motor, mejoras y correcciones de errores de OCR podrían afectar a la extracción de contenidos cuando se utiliza este motor de OCR en IQ Bot. Por lo tanto, le recomendamos que consulte periódicamente las notas de la versión API de Google Vision para conocer las últimas actualizaciones.

Consulte Impacto potencial de la actualización de OCRAPI de Google Vision.

Tiene las siguientes opciones para usar este motor OCR:
Opciones Descripción
Opción 1: Establecer API de Google Vision como su motor predeterminado Configure el archivo Settings.txt.
Restricción: La configuración del archivo settings.txt no se puede aplicar a Automation 360 IQ Bot Nube
Opción 2: Seleccione el motor API de Google Vision directamente desde la IU al crear una instancia de aprendizaje Seleccionar un motor OCR

Procedimiento

Para establecer API de Google Vision como su motor OCR predeterminado, configure el archivo Settings.txt de la siguiente manera:

Restricción: La configuración del archivo settings.txt no se puede aplicar a Automation 360 IQ Bot Nube

  1. Ejecute el instalador de IQ Bot.
  2. Opcional: Establezca API de Google Vision como el OCR predeterminado para las nuevas instancias de aprendizaje.
    Navegue hasta ..\Automation 360 IQ Bot\Configurations\Settings.txt y modifique el siguiente valor: OCREngine=GoogleVisionAPI.
    Esto establecerá el motor API de Google Vision OCR como el motor predeterminado para su entorno.
  3. El archivo GoogleOCREngineSettings.json se genera dentro de la carpeta ..\Automation 360 IQ Bot\Configurations con valores predeterminados de la siguiente manera:
    Utilice los siguientes con API de Google Vision:
    {
      "ADCJson": null,
      "EngineType": 2,
      "EnableFieldMerging": true,
      "EnableFieldRegions": true,
      "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google"
     }
  4. Para documentos en idioma japonés y coreano, actualice el siguiente campo: "EnableCustomParse": true.
    Nota: No se requiere un reinicio del servicio después de realizar el cambio.
Lista de las URL de servicio utilizadas para API de Google Vision (opcional)
Utilice las siguientes URL permitidas si es necesario:
Nota: Todas las URL apuntan a una región de servicio global en los EE. UU.
  • Dirección URL de la API: https://vision.googleapis.com/
  • Dirección URL de autorización: https://accounts.google.com/o/oauth2/auth
  • Dirección URL del token: https://oauth2.googleapis.com/token
  • Dirección URL del proveedor de autorización: https://www.googleapis.com/oauth2/v1/certs
  • Dirección URL de autorización del cliente: https://www.googleapis.com/robot/v1/metadata/x509

Qué hacer a continuación

  1. Cree una nueva instancia de aprendizaje con el documento en idioma asiático que desea capacitar.
  2. Entrene con el documento y ponga en producción su instancia de aprendizaje.
  3. Cargue archivos en idioma asiáticos y ejecute el bot.
  4. Descargue y vea la exactitud de los resultados de extracción.