Usar mecanismo Google Vision API de reconhecimento de caracteres ópticos

Use o mecanismo Google Vision API OCR com IQ Bot para aprimorar a precisão dos resultados de reconhecimento óptico de caracteres (OCR) para o treinamento de documentos em idiomas asiáticos, particularmente em japonês e coreano. O mecanismo Google Vision API OCR no IQ Bot oferece suporte a todos os idiomas compatíveis com o mecanismo.

Pré-requisitos

Verifique se a porta padrão 443 está disponível para habilitar a comunicação para o endpoint da API usando TCP.

Nota: Consulte uma lista de URLs de serviço permitidos para usar Google Vision API na seção de exemplo abaixo.
Os arquivos Google Vision API são instalados automaticamente em sua máquina durante a instalação de IQ Bot e são fornecidos como um plug-in integrado, com uma instalação de etapa única, e estão disponíveis para todos os usuários:
  • É um mecanismo OCR na nuvem.
  • O Google Vision API não é compatível com documentos com mais de um idioma. Antes de usar esse recurso, certifique-se de que deseja extrair principalmente texto exclusivamente em japonês e coreano.
  • Idiomas escritos da direita para a esquerda, e não da esquerda para a direita, não são compatíveis com IQ Bot para extração de documentos. Por exemplo, árabe, aramaico, azeri, divehi, fula, hebraico, curdo, N'ko, persa, rohingya, siríaco e urdu.

    Antes desta versão, o mecanismo suportava principalmente a extração de dados apenas para textos em japonês e coreano.

    Idiomas compatíveis no IQ Bot do Automation 360

  • Os dados não são armazenados no Google Cloud e são removidos imediatamente.

    Para obter informações adicionais sobre privacidade para retenção de dados, consulte: Uso de dados do Google

O IQ Bot fornece a licença para usar o mecanismo Google Vision API OCR. Você também pode usar sua própria chave de licença.

Use suas próprias chaves de licença para o mecanismo de OCR do Google Vision API

Nota: Atualizações para Google Vision API tais como OCR melhorias no motor, melhorias e correções de bugs podem afetar a extração de conteúdo quando você usa este motor OCR em IQ Bot. Portanto, recomendamos que você se refira periodicamente ao Google Vision API notas de lançamento para as últimas atualizações.

Consulte Potencial impacto da atualização de OCR Google Vision API.

Você tem as seguintes opções para usar este mecanismo OCR:
Opções Descrição
Opção 1: Definir Google Vision API como seu mecanismo padrão Configure o arquivo Settings.txt.
Restrição: A configuração do arquivo settings.txt não é aplicável ao IQ Bot do Automation 360 Nuvem
Opção 2: Selecione o mecanismo Google Vision API diretamente na IU ao criar uma instância de aprendizado Selecionar um mecanismo OCR

Procedimento

Para definir o Google Vision API como seu mecanismo OCR padrão, configure o arquivo Settings.txt da seguinte forma:

Restrição: A configuração do arquivo settings.txt não é aplicável ao IQ Bot do Automation 360 Nuvem

  1. Execute o instalador do IQ Bot.
  2. Opcional: Conjunto Google Vision API como o OCR padrão para novas instâncias de aprendizagem.
    Acesse ..\Automation 360 IQ Bot\Configurations\Settings.txt e modifique o seguinte valor: OCREngine=GoogleVisionAPI.
    Isso definirá o mecanismo Google Vision API OCR como padrão para seu ambiente.
  3. O arquivo GoogleOCREngineSettings.json é gerado na pasta ..\Automation 360 IQ Bot\Configurations com os seguintes valores padrão:
    Use o seguinte com o Google Vision API:
    {
      "ADCJson": null,
      "EngineType": 2,
      "EnableFieldMerging": true,
      "EnableFieldRegions": true,
      "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google"
     }
  4. Para documentos em japonês e coreano, atualize o seguinte campo: "EnableCustomParse": true.
    Nota: Não é necessário reiniciar o serviço após fazer a alteração.
Lista de URLs de serviço usados para Google Vision API (opcional)
Use os seguintes URLs permitidos, se necessário:
Nota: Todas as URLs apontam para uma região de serviço global nos EUA.
  • URL da API: https://vision.googleapis.com/
  • URL de autenticação: https://accounts.google.com/o/oauth2/auth
  • URL do Token: https://oauth2.googleapis.com/token
  • URL do provedor de autenticação: https://www.googleapis.com/oauth2/v1/certs
  • URL de autenticação do cliente: https://www.googleapis.com/robot/v1/metadata/x509

Próximas etapas

  1. Crie uma nova instância de aprendizado com o documento de idioma asiático que deseja usar para treinar.
  2. Treine o documento e defina sua instância de aprendizado para produção.
  3. Faça o upload dos arquivos de idioma asiático e execute o bot.
  4. Baixe e veja a precisão dos resultados da extração.