Cloud Extraction Service-Architektur

Die Cloud Extraction Service-Architektur skizziert den Datenfluss der Dokumentenverarbeitung und beschreibt die Phasen des Hochladens, Extrahierens und Herunterladens von Daten unter Verwendung verschiedener Komponenten und Drittanbieterdienste.

Die folgende Cloud Extraction Service-Architektur bietet einen umfassenden Überblick über die verschiedenen Phasen des Datenflusses bei der Dokumentenverarbeitung.

Anmerkung:
  • Bring Your Own Key (BYOK) wird in Cloud Extraction Service nicht unterstützt.
  • Informationen darüber, wie Dokumente in Document Automation gespeichert werden, finden Sie unter FAQs zur Document Automation-Sicherheit.

Das folgende Bild zeigt eine Übersicht der verschiedenen Komponenten, die in Cloud Extraction Service verwendet werden:

Diagramm des Dokumentenverarbeitungs-Workflows bei Verwendung der Cloud Extraction Service-Funktion
Kundennetzwerk
Das Kundennetzwerk ist der Ort, an dem der Datenextraktionsprozess gestartet wird.
  • Eingabe: Dieser Prozess beinhaltet das Hochladen der Dokumente, die für die Datenextraktion verarbeitet werden müssen.
  • bot hochladen: Dieser Vorgang beinhaltet das Hochladen der Dokumente zu den Speicherdiensten der Control Room Cloud.
  • bot herunterladen: Dieser Prozess beinhaltet das Herunterladen der extrahierten Informationen aus den Dokumenten.
  • Ausgabe: Dieser Prozess beinhaltet das Speichern der extrahierten Informationen.
Automation Anywhere Cloud
Control Room (nur Cloud): Orchestriert den Datenextraktionsprozess, indem vom Bot Runner-Gerät ausgehende Anfragen bestätigt werden.
Cloud Extraction Service: Dieser Prozess beinhaltet das Extrahieren von Informationen aus Dokumenten, indem Anfragen an OCR und externe Cloud-Dienste gesendet werden. Alle Datenextraktionsanfragen werden über Cloud Extraction Service gesendet und empfangen.
Drittanbieter-Cloud-Dienste
Google Vision OCR: Dieser Prozess beinhaltet die Umwandlung von Dokumenten in ein maschinenlesbares Format und die Dokumente werden für OCR auf Google Cloud verarbeitet.
LLM-Anbieter: Dieser Prozess beinhaltet die Datenextraktion mithilfe von Drittanbieter-generative AI-Modellen.

Datenextraktion mit generative AI-Anbietern

Das folgende Bild zeigt den End-to-End-Datenfluss durch verschiedene Komponenten für generative AI-Anbieter:

Datenflussdiagramm für generative AI-Anbieter bei Verwendung der Cloud Extraction Service-Funktion

Die folgenden Abschnitte stellen verschiedene Phasen des Datenflusses durch verschiedene Komponenten bei der Verwendung von generative AI-Anbietern dar:

Stufe 1: Hochladen von Dateien in den Control Room

Datenflussdiagramm, das den Datei-Upload zum Control Room zeigt

Der Nutzer lädt Dateien in den Control Room hoch oder ein Zeitplaner-bot lädt die Datei von einem gemeinsamen Speicherort hoch. Die Dateien werden vorübergehend auf den Control Room-Speicherdiensten hochgeladen.

Stufe 2: Dokumentenextraktionsprozess

Datenflussdiagramm des Dokumentenextraktionsprozesses

Der Control Room startet den Datenextraktionsprozess entweder mit den vortrainierten Automation Anywhere-Modellen oder mit externen Cloud-Extraktionsdiensten.

  • Vortrainierte Automation Anywhere-Modelle: Die Datenextraktion wird mit Cloud Extraction Service durchgeführt.
  • Document Automation-Abonnements: Datenextraktionsanfragen werden über das Automation Anywhere Proxy-Gateway an die Drittanbieter-Cloud-Extraktionsdienste gesendet und empfangen.
Stufe 3: Ausgabe herunterladen

Datenflussdiagramm des Herunterladens der Ausgabe

Die Ergebnisse der Datenextraktion werden auf dem vom Nutzer definierten Netzwerkpfad als CSV oder JSON heruntergeladen. Kunden erstellen in der Regel bots, um diese Informationen in nachgelagerte Anwendungen oder Aufzeichnungssysteme hochzuladen.

Datenextraktion mit Microsoft Azure AI Document Intelligence

Das folgende Bild zeigt den End-to-End-Datenfluss durch verschiedene Komponenten für Microsoft Azure AI Document Intelligence:

Datenflussdiagramm für Microsoft Azure AI Document Intelligence bei Verwendung der Funktion Cloud Extraction Service

Stufe 1: Dateien hochladen und Konfigurationsdetails abrufen

Datenflussdiagramm, das den Datei-Upload zum Control Room zeigt

Der Nutzer lädt Dateien in den Control Room hoch oder ein Zeitplaner-bot lädt die Datei von einem gemeinsamen Speicherort hoch. Die Dateien werden vorübergehend auf den Control Room-Speicherdiensten hochgeladen.

Stufe 2: Datenextraktionsprozess

Datenflussdiagramm des Dokumentenextraktionsprozesses unter Verwendung von Microsoft Azure AI Document Intelligence-Diensten

Der Control Room initiiert den OCR und den Datenextraktionsprozess unter Verwendung von Cloud Extraction Service. Datenextraktionsanfragen werden direkt von Microsoft Azure AI Document Intelligence-Diensten für Document Automation-Abonnements gesendet und empfangen. Die Ergebnisse der Datenauswertung werden an den Control Room gesendet.

Stufe 3: Ausgabe herunterladen

Datenflussdiagramm des Herunterladens der Ausgabe

Die Ergebnisse der Datenextraktion werden auf dem vom Nutzer definierten Netzwerkpfad als CSV oder JSON heruntergeladen. Kunden erstellen in der Regel bots, um diese Informationen in nachgelagerte Anwendungen oder Aufzeichnungssysteme hochzuladen.