Usar mecanismo Google Vision API de reconhecimento de caracteres ópticos
Use a versão beta do mecanismo Google Vision API OCR com IQ Bot Version 11.3.4 para aprimorar a precisão dos resultados de reconhecimento óptico de caracteres (Optical character recognition, OCR) para o treinamento de documentos em idiomas asiáticos, particularmente em japonês e coreano. Google Vision API O mecanismo OCR (GA) no IQ Bot Version 11.3.5 oferece suporte a todos os idiomas compatíveis com o mecanismo.
Pré-requisitos
Verifique se a porta padrão 443 está disponível para habilitar a comunicação para o endpoint da API usando TCP.
- É um mecanismo OCR na nuvem.
- (Beta) A Google Vision API não é compatível com documentos com mais de um idioma. Antes de usar esse recurso, certifique-se de que deseja extrair principalmente texto exclusivamente em japonês e coreano.
- O IQ Bot Version 11.3.5 é compatível com todos os idiomas suportados pelo mecanismo Google Vision API OCR. Nota: Idiomas escritos da direita para a esquerda, e não da esquerda para a direita, não são compatíveis com IQ Bot para extração de documentos. Por exemplo, árabe, aramaico, azeri, divehi, fula, hebraico, curdo, N'ko, persa, rohingya, siríaco e urdu.
Antes desta versão, o mecanismo suportava principalmente a extração de dados apenas para textos em japonês e coreano.
- Os dados não são armazenados no Google Cloud e são removidos imediatamente.
Para obter informações adicionais sobre privacidade para retenção de dados, consulte: Google Data Usage
O IQ Bot fornece a licença para usar o mecanismo Google Vision API OCR. Você também pode usar sua própria chave de licença.
Use suas próprias chaves de licença para o mecanismo de OCR do Google Vision API
Opções | Descrição |
---|---|
Opção 1: Definir Google Vision API como seu mecanismo padrão | Configure o arquivo Settings.txt. |
Opção 2: Selecionar o mecanismo Google Vision API diretamente na IU ao criar uma instância de aprendizado | Selecionar um mecanismo OCR |
Procedimento
Para definir o Google Vision API como seu mecanismo OCR padrão, configure o arquivo Settings.txt da seguinte forma:
- URL da API em: https://vision.googleapis.com/
- URL de autenticação: https://accounts.google.com/o/oauth2/auth
- URL do Token em: https://oauth2.googleapis.com/token
- URL do provedor de autenticação: https://www.googleapis.com/oauth2/v1/certs
- URL de autenticação do cliente: https://www.googleapis.com/robot/v1/metadata/x509
Próximas etapas
- Crie uma nova instância de aprendizado com o documento de idioma asiático que deseja treinar.
- Treine o documento e defina sua instância de aprendizado para produção.
- Faça upload dos arquivos de idioma asiático e execute o bot.
- Baixe e visualize a precisão dos resultados da extração.