Tipos de documento

O tipo de documento é a classificação de documentos com base em sua finalidade, layout e conteúdo. Automação de documentos é compatível com os seguintes tipos de documentos para processamento: documentos estruturados, semiestruturados e não estruturados.

Documentos estruturados

Documentos estruturados seguem uma estrutura consistente e um layout claro onde os dados são digitados ou escritos, facilitando a extração e o processamento de dados por sistemas automatizados. O modelo de extração de dados usado para tais documentos usa uma combinação de recursos de reconhecimento óptico de caracteres (OCR) com modelo baseado em template para extrair pares de valor-chave e dados de tabela de documentos estruturados.

A seguir estão alguns exemplos de documentos estruturados:

  • Formulários de inscrição
  • Pesquisas
  • Passaportes
  • Formulários fiscais

Documentos semiestruturados

Documentos semiestruturados têm alguma estrutura ou formato previsível, como documentos estruturados, mas também algumas variações no layout ou conteúdo. Alguns documentos podem conter elementos de dados comuns, mas os dados podem estar em locais diferentes e em documentos diferentes. O modelo de extração de dados usado para esses documentos usa uma combinação de recursos de OCR com extração baseada em palavras-chave, expressões regulares e feedback de validação para extrair pares de valores-chave e dados de tabela de documentos semiestruturados.

A seguir estão alguns exemplos de documentos semiestruturados:

  • Faturas
  • Pedidos de compra (PO)
  • Conhecimentos de embarque
  • Explicações de benefícios (EOB)

Documentos não estruturados

Documentos não estruturados não têm um formato padrão, layout fixo ou dados sem rótulos. Os dados estão, em sua maioria, em um formato de linguagem natural, sem uma estrutura consistente. O modelo de extração de dados usa uma combinação de recursos de OCR com processamento de linguagem natural (PLN) e tecnologias de IA generativa para executar análises semânticas e extrair pares de valor-chave e dados de tabela de documentos não estruturados.

A seguir estão alguns exemplos de documentos não estruturados:

  • Documentos legais
  • Correspondência (incluindo e-mails)
  • Relatórios

Automação de documentos pode gerenciar com extração de dados de todos esses tipos de documentos. No entanto, entender em qual categoria seus documentos se enquadram é importante para decidir quais opções usar para extrair dados.