Extração de dados com tecnologia de visão IA generativa

Os modelos de IA generativa baseados em visão aprimoram a automação de documentos, melhorando a precisão da extração de dados de documentos complexos e não estruturados, utilizando recursos como análise de layout e reconhecimento de campos de formulários. Esses modelos simplificam os fluxos de trabalho ao reduzir a intervenção humana e são compatíveis em várias regiões por provedores como Microsoft OpenAI e Anthropic Claude.

Nota: Certifique-se de estar usando o pacote Extração de documentos versão 3.35.14 ou posterior para usar os modelos de IA generativa baseados em visão.

A integração de modelos de IA generativa baseados em visão no Document Automation ajudará a processar documentos com estruturas visualmente complexas, como reconhecer caixas de seleção e detectar assinaturas.

Quando você utiliza o pacote que suporta modelos IA generativa com tecnologia de visão, pode usar a tag de prompt @GenAIVision para indicar ao mecanismo Extração de documentos que utilize modelos IA generativa com tecnologia de visão para extração de dados. Para obter mais informações, consulte Usar tags de prompts de IA generativa.

Recursos

A imagem a seguir mostra alguns dos recursos dos modelos de IA generativa baseados em visão usados no Document Automation:

Document Automation com recursos de modelos de IA generativa baseados em visão

O Document Automation com modelos de IA generativa baseados em visão oferecem os seguintes recursos aprimorados em relação a outros modelos de IA generativa:

  • Análise de layout
  • Reconhecimento de campo de formulários
  • Reconhecimento de tabela
  • Reconhecimento de imagens e gráficos
  • Reconhecimento de assinaturas e caixas de seleção

Benefícios

Modelos de IA generativa com tecnologia de visão oferecem os seguintes benefícios:

Extração de dados sem interrupções
Extrai dados de tabelas complexas com linhas aninhadas, colunas mescladas e seções. Reconhece e captura elementos de seleção, como caixas de marcação.
Desenvolvidos para casos de uso do mundo real
Supera os desafios de extrair dados de vários tipos de documentos, como faturas, pedidos de compra, documentos de saúde e documentos da cadeia de suprimentos.
Configuração simplificada
Usa modelos pré-treinados que funcionam imediatamente, nos quais as consultas de pesquisa são usadas para identificar e extrair informações.

Matriz de suporte de regiões

A tabela a seguir apresenta os modelos de IA generativa baseados em visão compatíveis com provedores de IA generativa em diferentes regiões:

Nota: Se você estiver usando Bring Your Own License (BYOL) para um provedor, essas configurações não serão consideradas. Para configurar BYOL para um provedor, consulte ação Extrair dados.
Regiões Provedores O modelo de IA generativa baseado em visão é compatível? Modelos de IA generativa compatíveis
Estados Unidos Microsoft OpenAI Sim GPT-4o
Anthropic Claude (Amazon Bedrock) Sim Claude 3 Haiku
Europa Microsoft OpenAI Sim GPT-4o
Anthropic Claude (Amazon Bedrock) Sim Claude 3 Haiku
Restante do mundo Microsoft OpenAI Não* GPT-3.5 Turbo
Anthropic Claude (Amazon Bedrock) Sim Claude 3 Haiku

* Você pode configurar o BYOL para usar seu próprio modelo de IA generativa baseado em visão para extração de dados. Consulte ação Extrair dados.