Tipos de documento
- Última atualização2024/12/16
Tipos de documento
O tipo de documento é a classificação de documentos com base em sua finalidade, layout e conteúdo. O Document Automation oferece suporte aos seguintes tipos de documentos para processamento: documentos estruturados, semiestruturados e não estruturados.
Documentos estruturados
Documentos estruturados seguem uma estrutura consistente e um layout claro onde os dados são digitados ou escritos, facilitando a extração e o processamento de dados por sistemas automatizados. O modelo de extração de dados usado para tais documentos usa uma combinação de recursos de reconhecimento óptico de caracteres (OCR) com modelo baseado em template para extrair pares de valor-chave e dados de tabela de documentos estruturados.
A seguir estão alguns exemplos de documentos estruturados:
- Formulários de inscrição
- Pesquisas
- Passaportes
- Formulários fiscais
Documentos semiestruturados
Documentos semiestruturados têm alguma estrutura ou formato previsível, como documentos estruturados, mas também algumas variações no layout ou conteúdo. Alguns documentos podem conter elementos de dados comuns, mas os dados podem estar em locais diferentes e em documentos diferentes. O modelo de extração de dados usado para esses documentos usa uma combinação de recursos de OCR com extração baseada em palavras-chave, expressões regulares e feedback de validação para extrair pares de valores-chave e dados de tabela de documentos semiestruturados.
A seguir estão alguns exemplos de documentos semiestruturados:
- Faturas
- Pedidos de compra (PO)
- Conhecimento de embarque
- Explicações de benefícios (EOB)
Documentos não estruturados
Documentos não estruturados não têm um formato padrão, layout fixo ou dados sem rótulos. Os dados estão, em sua maioria, em um formato de linguagem natural, sem uma estrutura consistente. O modelo de extração de dados usa uma combinação de recursos de OCR com processamento de linguagem natural (PLN) e tecnologias de IA generativa para executar análises semânticas e extrair pares de valor-chave e dados de tabela de documentos não estruturados.
A seguir estão alguns exemplos de documentos não estruturados:
- Documentos legais
- Correspondência (incluindo e-mails)
- Relatórios