Prise en charge de Document Automation pour Google Custom Document Extractor (CDE)

Dans Automatisation de documents, vous pouvez créer une instance d'apprentissage entraînée par l'utilisateur et l'extraire à l'aide d'un processeur Google Custom Document Extractor (CDE).

Cette nouvelle fonctionnalité peut être utilisée pour entraîner un modèle à l'aide de Google Custom Document Extractor (CDE) pour n'importe quel type de document en 50  langues. Dès le modèle déployé, l'URL du processeur peut être intégrée dans le processus d'extraction Automatisation de documents.

Pour utiliser Google CDE, vous devez disposer des éléments suivants :
  • Abonnement Google au Workbench Google Document AI.
  • Rôle Document AI Editor pour la création de processeurs et vous devez avoir créé un compte de service sur votre Google Cloud Platform. Reportez-vous aux rubriques Create service accounts et IAM roles for Document AI.
  • Licence pour Plateforme Document Automation > Pages de l'espace de travail documentaire.
Remarque : Lorsque vous travaillez avec la liste de confiance des URL d'API pour Google CDE, vous devez ajouter toutes les API à la liste de confiance sur la machine Agent de robot. La liste des API autorisées pour Google CDE est la suivante :
  • Comptes Google
  • Google OAuth
  • Google APIS
  • Point de terminaison du processeur (seul l'hôte doit être ajouté à la liste de confiance)
    Par exemple :
    https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process

Utilisation de Google CDE

L'effort nécessaire pour créer et maintenir des modèles avec Google CDE est justifié par différents scénarios, notamment :
  • Prise en charge linguistique étendue : Lorsque l'on gère des documents qui nécessitent la prise en charge de langues supplémentaires et que les modèles pré-entraînés existants n'offrent pas cette possibilité, Google CDE devient essentiel.

    Pour les langues prises en charge, voir Support linguistique pour Google CDE.

  • Formats de documents non pris en charge : Google CDE est utile lorsqu'il s'agit de types de documents pour lesquels il n'existe pas d'analyseurs syntaxiques compatibles.
  • Relever les défis de la précision et de la performance : Dans des formats de documents spécifiques, même à l'aide de modèles pré-entraînés, il peut être difficile d'obtenir la précision souhaitée. Google CDE ayant reçu un entraînement spécifique sur les documents peut fournir une meilleure précision.
  • Extraction de champs personnalisés ou non standard : Google CDE peut être utilisé dans des scénarios où des champs spécifiques doivent être extraits de documents au format personnalisé ou non standard.
  • Extraction basée sur un entraînement spécifique lorsque les étiquettes n'existent pas : Google CDE est utile lorsqu'il est nécessaire d'extraire des informations de champs pour lesquels il n'existe pas d'étiquettes prédéfinies.