Selecionar um mecanismo OCR

Você pode selecionar um mecanismo OCR que atenda às suas necessidades de extração de dados, com base nos seus tipos de documento. Não é necessário reiniciar os serviços IQ Bot para implementar uma mudança de mecanismo.

Durante a instalação do IQ Bot, o sistema define a versão mais recente do Leitor de caracteres ópticos Tesseract como o mecanismo OCR padrão. Essa também é a configuração padrão do produto. No entanto, você pode definir manualmente o mecanismo OCR no arquivo Settings.txt, que se torna o mecanismo padrão. Semelhante às versões anteriores do IQ Bot, você pode continuar a atualizar manualmente o arquivo Settings.txt com o nome do mecanismo OCR que deseja definir como padrão.

Ao criar uma instância de aprendizado, você pode selecionar um mecanismo OCR do menu suspenso Reconhecimento de caractere óptico. Ver Criar instância de aprendizado
Nota: Selecionar um mecanismo OCR na interface do usuário substitui as configurações no arquivo Settings.txt.

A tabela a seguir lista os vários mecanismos OCR compatíveis com IQ Bot e as opções correspondentes:

Tabela 1. Lista de mecanismos OCR e suas especificações
Qualificadores Versão de OCR Instalação compatível Manuscrito Idiomas compatíveis Qualidade do documento Tipo de documento
Tesseract OCR 4 Nuvem e No local N/D

Inglês

Alemão

Espanhol

Italiano

Francês

Sem ruído

Sem fundo escuro

Sem carimbos/ marcas d'água

200+ dpi

Faturas, OCs etc.

Formatos semiestruturados

Mecanismo ABBYY FineReader 12.3 ou 12.4 Nuvem e No local N/D

Inglês

Todos latinos+

Chinês

Japonês

Coreano

Menos ruído

Fundo escuro com fontes brancas

Possui carimbos/marcas d'água

96+ dpi

Faturas, OCs etc.

Formatos semiestruturados

Formulários de hipoteca, formulários fiscais

Formatos não estruturados

Mecanismo de OCR Microsoft Azure Computer Vision 2,0 ou 3,2 Nuvem e No local Somente em inglês

Inglês

Todos latinos+

Chinês

Japonês

Coreano

Menos ruído

Fundo escuro

Possui carimbos/marcas d'água

96+ dpi

Faturas, OCs etc.

Formatos semiestruturados

Passaportes, carteira de habilitação etc.

Documentos KYC

Google Vision API A versão é atualizada automaticamente para corresponder à versão atual Nuvem e No local N/D

Inglês

Todos latinos+

Asiático

Menos ruído

Fundo escuro

Possui carimbos/marcas d'água

96+ dpi

Faturas, OCs etc.

Formatos semiestruturados

Formulários de hipoteca, formulários fiscais

Formatos não estruturados

Procedimento

  1. Na página Criar uma nova instância de aprendizado, selecione o domínio e o idioma dos documentos.
    Na página da lista Minha instância de aprendizado, uma nova coluna Mecanismo de OCR está disponível e mostra o mecanismo OCR usado para criar cada instância de aprendizado. Essa informação é útil para o usuário, ao decidir sobre o processamento de documentos.
  2. As seções Campos a extrair e Configurações avançadas são exibidas quando você seleciona o domínio.
    Cada domínio está disponível com uma lista predefinida de idiomas principais suportados. A seleção de idioma está ativada e disponível na lista suspensa Idioma principal de documentos, com base nos idiomas suportados para um domínio específico.
    Nota: Se você selecionar um idioma na lista suspensa Idioma principal de documentos e, em seguida, selecionar um mecanismo que não suporte esse idioma, o sistema exibirá uma mensagem de erro na lista suspensa Reconhecimento de caracteres ópticos.
  3. Clique em Configurações avançadas > Reconhecimento de caracteres ópticos para exibir a lista suspensa de opções do mecanismo OCR.

    Se a seleção do mecanismo OCR for inválida, a opção Criar instância e analisar não estará habilitada.

    Nota: O IQ Bot instala automaticamente todos os mecanismos OCR durante o processo de instalação, exceto o Mecanismo ABBYY FineReader.
    Importante: Você só pode configurar os mecanismos OCR em IQ Bot do Automation 360 No local. OCR em IQ Bot do Automation 360 Nuvem não podem ser editadas, pois não são acessíveis, exceto para Mecanismo ABBYY FineReader. Edite os ajustes de configuração para Mecanismo ABBYY FineReader usando a API REST appConfigurations.

    Você pode selecionar o seguinte:

    OpçãoDescrição
    Tesseract OCR 4 Este é o mecanismo padrão, a menos que seja alterado no arquivo Settings.txt.
    Mecanismo ABBYY FineReader

    Para verificar se o Mecanismo ABBYY FineReader está instalado e disponível para uso, verifique o arquivo Settings.txt, a pasta OCR Plug-ins para os arquivos SDK e a lista suspensa Reconhecimento de caracteres ópticos.

    Nota: Também é compatível com IQ Bot [Dispositivo local] pacote e Extração do IQ Bot pacote.

    Usar o mecanismo de Mecanismo ABBYY FineReaderOCR no IQ Bot

    Mecanismo de OCR Microsoft Azure Computer Vision O IQ Bot é compatível com todos os idiomas suportados por este mecanismo OCR.

    Usar o Mecanismo de OCR Microsoft Azure Computer Vision

    Google Vision API O IQ Bot suporta ao Google Vision API como mecanismo OCR e oferece suporte a todos os idiomas compatíveis com o mecanismo.

    Usar mecanismo Google Vision API de reconhecimento de caracteres ópticos

    Meus documentos PDF não têm imagens

    Todos os documentos PDF que você carrega são processados usando o OCR PDFBox por padrão, independentemente do mecanismo OCR especificado ou selecionado.

    Se estiver carregando documentos não PDF ou documentos PDF que contenham imagens, limpe a caixa de seleção Meus documentos PDF não têm imagens para garantir que o mecanismo OCR especificado ou selecionado é usado para processar os documentos.

    A caixa de seleção Meus documentos PDF não têm imagens está ativada por padrão. Para desativar esse recurso, consulte Desative a opção PDFBox.
    Dica: Se o IQ Bot não conseguir extrair dados de documentos de baixa qualidade ou manuscritos, solucione o problema:

    O IQ Bot não consegue extrair dados de documentos manuscritos e de baixa qualidade (login no A-People necessário)

    Nota: Utilize os seguintes arquivos para alterar as configurações do OCR:
    • AbbyyImagePreProcessingSettings.json
    • LangugeCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    Como alterar as configurações de OCR no IQ Bot (login no A-People necessário)