Cloud-Extraktionsaufgabe:-Architektur

Die Cloud-Extraktionsaufgabe:-Architektur skizziert den Datenfluss der Dokumentenverarbeitung und beschreibt die Phasen des Hochladens, Extrahierens und Herunterladens von Daten unter Verwendung verschiedener Komponenten und Drittanbieterdienste.

Die folgende Cloud-Extraktionsaufgabe:-Architektur bietet einen umfassenden Überblick über die verschiedenen Phasen des Datenflusses bei der Dokumentenverarbeitung.

Anmerkung:
  • Bring Your Own Key (BYOK) wird in Cloud-Extraktionsaufgabe: nicht unterstützt.
  • Informationen darüber, wie Dokumente in Document Automation gespeichert werden, finden Sie unter FAQs zur Document Automation-Sicherheit.

Das folgende Bild zeigt eine Übersicht der verschiedenen Komponenten, die in Cloud-Extraktionsaufgabe: verwendet werden:

Diagramm des Dokumentenverarbeitungs-Workflows bei Verwendung der Cloud-Extraktionsaufgabe:-Funktion
Kundennetzwerk
Das Kundennetzwerk ist der Ort, an dem der Datenextraktionsprozess gestartet wird.
  • Eingabe: Dieser Prozess beinhaltet das Hochladen der Dokumente, die für die Datenextraktion verarbeitet werden müssen.
  • Bot hochladen: Dieser Vorgang beinhaltet das Hochladen der Dokumente zu den Speicherdiensten der Control Room Cloud.
  • Bot herunterladen: Dieser Prozess beinhaltet das Herunterladen der extrahierten Informationen aus den Dokumenten.
  • Ausgabe: Dieser Prozess beinhaltet das Speichern der extrahierten Informationen.
Automation Anywhere Cloud
Control Room (nur Cloud): Orchestriert den Datenextraktionsprozess, indem vom Bot Runner-Gerät ausgehende Anfragen bestätigt werden.
Cloud-Extraktionsaufgabe:: Dieser Prozess beinhaltet das Extrahieren von Informationen aus Dokumenten, indem Anfragen an OCR und externe Cloud-Dienste gesendet werden. Alle Datenextraktionsanfragen werden über Cloud-Extraktionsaufgabe: gesendet und empfangen.
Drittanbieter-Cloud-Dienste
Google Vision OCR: Dieser Prozess beinhaltet die Umwandlung von Dokumenten in ein maschinenlesbares Format und die Dokumente werden für OCR auf Google Cloud verarbeitet.
LLM-Anbieter: Dieser Prozess beinhaltet die Datenextraktion mithilfe von Drittanbieter-generative KI-Modellen.

Datenextraktion mit generative KI-Anbietern

Das folgende Bild zeigt den End-to-End-Datenfluss durch verschiedene Komponenten für generative KI-Anbieter:

Datenflussdiagramm für generative KI-Anbieter bei Verwendung der Cloud-Extraktionsaufgabe:-Funktion

Die folgenden Abschnitte stellen verschiedene Phasen des Datenflusses durch verschiedene Komponenten bei der Verwendung von generative KI-Anbietern dar:

Stufe 1: Hochladen von Dateien in den Control Room

Datenflussdiagramm, das den Datei-Upload zum Control Room zeigt

Der Nutzer lädt Dateien in den Control Room hoch oder ein Zeitplaner-Bot lädt die Datei von einem gemeinsamen Speicherort hoch. Die Dateien werden vorübergehend auf den Control Room-Speicherdiensten hochgeladen.

Stufe 2: Dokumentenextraktionsprozess

Datenflussdiagramm des Dokumentenextraktionsprozesses

Der Control Room startet den Datenextraktionsprozess entweder mit den vortrainierten Automation Anywhere-Modellen oder mit externen Cloud-Extraktionsdiensten.

  • Vortrainierte Automation Anywhere-Modelle: Die Datenextraktion wird mit Cloud-Extraktionsaufgabe: durchgeführt.
  • Document Automation-Abonnements: Datenextraktionsanfragen werden über das Automation Anywhere Proxy-Gateway an die Drittanbieter-Cloud-Extraktionsdienste gesendet und empfangen.
Stufe 3: Ausgabe herunterladen

Datenflussdiagramm des Herunterladens der Ausgabe

Die Ergebnisse der Datenextraktion werden auf dem vom Nutzer definierten Netzwerkpfad als CSV oder JSON heruntergeladen. Kunden erstellen in der Regel Bots, um diese Informationen in nachgelagerte Anwendungen oder Aufzeichnungssysteme hochzuladen.

Datenextraktion mit Microsoft Azure AI Document Intelligence

Das folgende Bild zeigt den End-to-End-Datenfluss durch verschiedene Komponenten für Microsoft Azure AI Document Intelligence:

Datenflussdiagramm für Microsoft Azure AI Document Intelligence bei Verwendung der Funktion Cloud-Extraktionsaufgabe:

Stufe 1: Dateien hochladen und Konfigurationsdetails abrufen

Datenflussdiagramm, das den Datei-Upload zum Control Room zeigt

Der Nutzer lädt Dateien in den Control Room hoch oder ein Zeitplaner-Bot lädt die Datei von einem gemeinsamen Speicherort hoch. Die Dateien werden vorübergehend auf den Control Room-Speicherdiensten hochgeladen.

Stufe 2: Datenextraktionsprozess

Datenflussdiagramm des Dokumentenextraktionsprozesses unter Verwendung von Microsoft Azure AI Document Intelligence-Diensten

Der Control Room initiiert den OCR und den Datenextraktionsprozess unter Verwendung von Cloud-Extraktionsaufgabe:. Datenextraktionsanfragen werden direkt von Microsoft Azure AI Document Intelligence-Diensten für Document Automation-Abonnements gesendet und empfangen. Die Ergebnisse der Datenauswertung werden an den Control Room gesendet.

Stufe 3: Ausgabe herunterladen

Datenflussdiagramm des Herunterladens der Ausgabe

Die Ergebnisse der Datenextraktion werden auf dem vom Nutzer definierten Netzwerkpfad als CSV oder JSON heruntergeladen. Kunden erstellen in der Regel Bots, um diese Informationen in nachgelagerte Anwendungen oder Aufzeichnungssysteme hochzuladen.