Suporte ao Document Automation para o Google Custom Document Extractor (CDE)

Em Document Automation, você pode criar uma instância de aprendizado treinada pelo usuário e extrair usando um processador Google Custom Document Extractor (CDE).

O novo recurso pode ser usado para treinar um modelo usando o Google Custom Document Extractor (CDE) para qualquer tipo de documento em 50 idiomas. Depois que um modelo é implantado, o URL do processador pode ser incorporado ao processo de extração do Document Automation.

Para usar o Google CDE, você precisa ter:
  • Uma assinatura do Google para workbench do IA do Google Document.
  • Recebido a atribuição de função Editor do Document AI para criar processadores e criado uma conta de serviço em seu Google Cloud Platform. Consulte Create service accounts e IAM roles for Document AI.
  • Uma licença para Plataforma do Document Automation > Páginas do espaço de trabalho do documento.
Nota: Ao trabalhar com a lista confiável de URLs de API para Google CDE, você deve adicionar todas as APIs à lista confiável na máquina do Agente de bot. A lista de APIs permitidas para o Google CDE é a seguinte:
  • Contas do Google
  • Google OAuth
  • APIS do Google
  • Ponto final do processador (apenas o host a ser adicionado à lista confiável)
    Por exemplo,
    https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process

Uso do Google CDE

O esforço envolvido na criação e na manutenção de modelos com o Google CDE é justificado por vários cenários, incluindo:
  • Suporte estendido a idiomas: Ao trabalhar com documentos que exigem suporte para outros idiomas e os modelos pré-treinados existentes não oferecem esse recurso, o Google CDE se torna essencial.

    Para idiomas suportados, consulte Suporte a idiomas para Google CDE.

  • Formatos de documentos não compatíveis: O Google CDE é útil ao lidar com tipos de documentos que não possuem analisadores compatíveis.
  • Lidar com os desafios de precisão e desempenho: Em formatos de documentos específicos, mesmo com o uso de modelos pré-treinados, pode ser difícil obter a precisão desejada. O Google CDE com treinamento específico em documentos pode fornecer melhor precisão.
  • Extração de campos personalizados ou não padronizados: O Google CDE pode ser usado em cenários em que campos específicos precisam ser extraídos de documentos com formatos personalizados ou fora do padrão.
  • Extração baseada em treinamento específico quando não existem rótulos: O Google CDE é proveitoso quando há necessidade de extrair informações de campos em que não existem rótulos predefinidos.