Automation 360

Potencial impacto da atualização de OCR Google Vision API

Baixar como PDF

Contents (Conteúdo)

Potencial impacto da atualização de OCR Google Vision API

Baixar como PDF

Última atualização2022/09/02

O OCR Google Vision API é baseado em nuvem e, tipicamente, é atualizado para uma versão mais recente de acordo com o ciclo de lançamento do Google. Como resultado dessa atualização, pode ser observado um impacto no processamento e nos resultados da extração de documentos em IQ Bot.

Impacto na classificação de documentos em IQ Bot após a atualização do OCR Google Vision API

A classificação dos documentos é baseada no resultado do OCR, particularmente a ordem na qual os campos são detectados. Assim, se o conteúdo dos resultados do OCR variar, os resultados da classificação do documento similar processado anteriormente podem mostrar diferenças visíveis durante a extração de documentos.

A atualização automática afeta o serviço de classificadores de duas maneiras:

Diferentes grupos são atribuídos aos documentos: Os documentos, quando processados, serão atribuídos a diferentes grupos em relação ao que foram originalmente encaminhados até o momento. Conseqüentemente, algumas extrações de dados, que anteriormente eram bem sucedidas, podem falhar.
Novos grupos são criados: Os documentos que anteriormente eram processados com um grupo podem agora resultar na criação de um novo grupo.

Impacto na extração de dados em IQ Bot após atualização do OCR Google Vision API

Uma mudança na saída do OCR pode resultar nas seguintes diferenças durante a extração de dados de um tipo de documento semelhante:

Melhoria no reconhecimento do caractere e o impacto associado: Como resultado de um melhor reconhecimento de caracteres por palavra-chave, valores anteriormente não reconhecidos de um documento agora fornecerão melhores resultados de extração.
Nota: Se alguma lógica de processamento for escrita para corrigir a falta de caracteres detectados, ela pode causar problemas quando o documento for processado.
Degradação no reconhecimento do caracter e seu impacto: A validação pode falhar devido à degradação na saída do OCR, e o documento será encaminhado para o validador. Em um cenário em que não há uma configuração de validação, a saída de dados extraídos pode ver uma degradação.

Opções para mitigar

Se você encontrar qualquer uma das questões mencionadas anteriormente, as seguintes opções podem ser exploradas:

Retrair a instância de aprendizado existente para corrigir problemas com a classificação de documentos.
Escrever a lógica de processamento usando Python para mitigar os resultados da extração.
Avaliar a criação da instância de aprendizado com diferentes fornecedores de OCR apoiados pelo IQ Bot.
Emitir um ticket de apoio com Automation Anywhere.