Extração de dados com tecnologia de visão IA generativa
- Última atualização2025/02/14
Extração de dados com tecnologia de visão IA generativa
Os modelos de IA generativa baseados em visão aprimoram a automação de documentos, melhorando a precisão da extração de dados de documentos complexos e não estruturados, utilizando recursos como análise de layout e reconhecimento de campos de formulários. Esses modelos simplificam os fluxos de trabalho ao reduzir a intervenção humana e são compatíveis em várias regiões por provedores como Microsoft OpenAI e Anthropic Claude.
A integração de modelos de IA generativa baseados em visão no Document Automation ajudará a processar documentos com estruturas visualmente complexas, como reconhecer caixas de seleção e detectar assinaturas.
Quando você utiliza o pacote que suporta modelos IA generativa com tecnologia de visão, pode usar a tag de prompt @GenAIVision para indicar ao mecanismo Extração de documentos que utilize modelos IA generativa com tecnologia de visão para extração de dados. Para obter mais informações, consulte Usar tags de prompts de IA generativa.
Recursos
A imagem a seguir mostra alguns dos recursos dos modelos de IA generativa baseados em visão usados no Document Automation:
O Document Automation com modelos de IA generativa baseados em visão oferecem os seguintes recursos aprimorados em relação a outros modelos de IA generativa:
- Análise de layout
- Reconhecimento de campo de formulários
- Reconhecimento de tabela
- Reconhecimento de imagens e gráficos
- Reconhecimento de assinaturas e caixas de seleção
Benefícios
Modelos de IA generativa com tecnologia de visão oferecem os seguintes benefícios:
- Extração de dados sem interrupções
- Extrai dados de tabelas complexas com linhas aninhadas, colunas mescladas e seções. Reconhece e captura elementos de seleção, como caixas de marcação.
- Desenvolvidos para casos de uso do mundo real
- Supera os desafios de extrair dados de vários tipos de documentos, como faturas, pedidos de compra, documentos de saúde e documentos da cadeia de suprimentos.
- Configuração simplificada
- Usa modelos pré-treinados que funcionam imediatamente, nos quais as consultas de pesquisa são usadas para identificar e extrair informações.
Matriz de suporte de regiões
A tabela a seguir apresenta os modelos de IA generativa baseados em visão compatíveis com provedores de IA generativa em diferentes regiões:
Regiões | Provedores | O modelo de IA generativa baseado em visão é compatível? | Modelos de IA generativa compatíveis |
---|---|---|---|
Estados Unidos | Microsoft OpenAI | Sim | GPT-4o |
Anthropic Claude (Amazon Bedrock) | Sim | Claude 3 Haiku | |
Europa | Microsoft OpenAI | Sim | GPT-4o |
Anthropic Claude (Amazon Bedrock) | Sim | Claude 3 Haiku | |
Restante do mundo | Microsoft OpenAI | Não* | GPT-3.5 Turbo |
Anthropic Claude (Amazon Bedrock) | Sim | Claude 3 Haiku |
* Você pode configurar o BYOL para usar seu próprio modelo de IA generativa baseado em visão para extração de dados. Consulte ação Extrair dados.