Document Automation – Datenextraktion mit generative KI
- Zuletzt aktualisiert2024/11/28
Document Automation – Datenextraktion mit generative KI
Document Automation für Automation 360 Cloud und Lokal bietet generative KI-Funktionen (GenAI), um Daten nahtlos aus unstrukturierten und halbstrukturierten Dokumenten zu extrahieren. Erstellen Sie eine Lerninstanz mit der Fähigkeit von GenAI zur Verarbeitung von Dokumenten in englischer Sprache unter Verwendung eines Large Language Model (LLM).
Vorteile
Verbessern Sie die Extraktionsgenauigkeit in einer Lerneinheit, indem Sie die Suchanfrage für das Generative KI-Modell Funktion verwenden, wenn Sie Formular- und Tabellenfelder definieren. Document Automation bietet eine standardmäßig anpassbare Abfrage basierend auf Ihrem ausgewählten Feld. Die Übermittlung Ihrer Anfrage an GenAI verbessert bzw. ermöglicht die Datenextraktion aus verschiedenen Dokumenttypen ohne vorheriges Training. Nutzen Sie diese Innovation, um Ihre Dokumentverarbeitungsfunktionen zu verbessern.
Wie generative KI die Extraktion verbessert
Wenn Sie eine Lerninstanz für unstrukturierte Dokumente erstellen (z. B.: Verträge, Vereinbarungen, Berichte, Briefe und E-Mails), wird die von GenAI gesteuerte Datenextraktionsfunktion automatisch ausgewählt. Während Sie die Formularfelder und Tabellenfelder für Ihre Lerninstanz definieren, können Sie die Option Suchanfrage für generatives KI-Modell nutzen, um Ihre Datenextraktionsanfrage anzupassen.
Für ein Adressfeld bietet die GenAI-Abfrage eine Standardabfrage wie z. B.:„Wie lautet die Adresse der Immobilie?“. Sie können diese Abfrage anpassen, um eine gezieltere Extraktion zu ermöglichen: „Wie lautet die vollständige Anschrift der Immobilie mit Stadt, Bundesland und Postleitzahl?“
Bei der Verarbeitung eines Dokuments mit dieser Lerninstanz extrahiert die GenAI die vollständige Adresse und nicht nur den Straßennamen und die Hausnummer. Sie müssen nur einmal die Suchanfrage im Modell definieren, und dann werden für jedes mit diesem Modell verarbeitete Dokument die Daten extrahiert, ohne dass eine zusätzliche Konfiguration erforderlich ist.
Bei der Erstellung einer Lerninstanz für halbstrukturierte Dokumente wie Rechnungen, nutzerdefinierte Dokumente und Bestellaufträge oder Supply-Chain-Dokumente, wie z. B.: Frachtbrief, Konnossement, Ankunftsanzeige und Packlisten, können Sie die von der GenAI gesteuerte Datenextraktion zusätzlich zur nativen Extraktion auf der Grundlage von benutzerdefinierten Aktualisierungen im Validator nutzen.
- Datenschutzhinweis: Wenn die generative KI-Funktion ausgewählt ist, wird die Anfrage an einen Drittanbieterdienst gesendet. Derzeit werden die Daten an den Microsoft Azure OpenAI-Dienst oder Anthropic gesendet, der auf Amazon Bedrock oder Google Vertex AI verfügbar ist. Wenn Sie nicht möchten, dass Ihre Daten an einen Drittanbieterdienst gesendet werden, wird empfohlen, nicht die sofort einsatzbereiten unstrukturierten und halbstrukturierten Dokumenttypen zu verwenden, bei denen die generative KI-Funktion verwendet wird. Die Matrix für die Unterstützung von Regionen finden Sie unter Document Automation settings.
- Wenn eine generative KI-Abfrage kein Ergebnis liefert, gibt das generative KI-Modell einen leeren Wert oder eine leere Antwort zurück. In einem solchen Szenario passen Sie Ihre Anfrage an, um das gewünschte Ergebnis zu erhalten.