Erstellen einer Lerninstanz in Community Edition

Erstellen Sie eine Lerninstanz, um mit der Verarbeitung von Dokumenten zu beginnen. In der Community Edition können Sie mit dem OCR-Anbieter ABBYY Daten aus unterstützten Dokumenttypen und Sprachen extrahieren.

Prozedur

  1. Navigieren Sie auf der Control Room-Startseite zu KI > Document Automation und klicken Sie auf Lerninstanz erstellen.
  2. Geben Sie einen Namen und eine Beschreibung für die Lerninstanz ein.
    Document Automation lässt keine doppelten Namen für Lerninstanzen zu, daher muss der von Ihnen angegebene Name eindeutig sein.
  3. Wählen Sie einen geeigneten Dokumenttyp aus.
    Anmerkung: Verwenden Sie den Dokumenttyp Nutzerdefiniert, um Dokumente zu verarbeiten, die visuell Rechnungen ähneln, wie z. B. Bestellungen und Kundenaufträge, die Schlüssel-Wert-Paare und eine Tabellenstruktur enthalten. In diesem Dokumenttyp erstellen und konfigurieren Sie alle Formular- und Tabellenfelder.
  4. Wählen Sie die Sprache.
  5. Optional: Mit der Option Genauigkeit durch Validierung verbessern können Sie Feedback zur Verbesserung der Extraktionsergebnisse an das System senden. Weitere Informationen finden Sie unter Verbessern der Extraktionsgenauigkeit durch Validierung.
  6. Optional: Wählen Sie die Option Generative KI-gesteuerte Datenextraktion, um die generative KI-Funktionen für die Extraktion zu nutzen. Weitere Informationen finden Sie unter Document Automation – Datenextraktion mit generative KI.

    Generative KI-Anbieter bieten die folgenden Vorteile:

    • Effiziente Verarbeitung großer, unstrukturierter Dokumente
    • Kann Dokumente in englischer und anderen Sprachen bearbeiten
    Wählen Sie einen der folgenden generative KI-Anbieter aus:
    Anmerkung:
    • Wenn Sie von einer früheren Version auf v.38 oder höher aktualisieren, wird Open AI als Standard-Extraktionsanbieter festgelegt.
    • Wenn Sie Dokumente mit OpenAI verarbeitet haben und dann zu Anthropic für die Datenextraktion gewechselt haben, verwenden nur die Dokumente, die nach dem Wechsel zu Anthropic verarbeitet werden, Anthropic für die Datenextraktion. Für die bereits verarbeiteten Dokumente werden die Daten mit Azure OpenAI extrahiert.
    • Open AI: Azure OpenAI-Modell wird für die Datenextraktion verwendet. Dieser Anbieter ist über eine eingebettete Lizenz (erfordert keine zusätzlichen Lizenzen) oder Bring Your Own License (BYOL) verfügbar.

      Wenn Sie BYOL verwenden, stellen Sie sicher, dass Sie die zusätzlichen Einstellungen für OpenAI in dem Extraktions-Bot konfigurieren, um diesen Anbieter zu verwenden. Einzelheiten finden Sie unter Aktion „Daten extrahieren“.

    • Anthropic: Sie können jetzt die Anthropic generative KI-Modelle über AWS und GCP für die Datenextraktion in Document Automation verwenden. Dieses Angebot bietet Ihnen die Flexibilität, das generative KI-Modell je nach Cloud-Anbieter auszuwählen, den Ihr Unternehmen zertifiziert hat.

      Wenn Sie BYOL nutzen, müssen Sie das Anthropic Claude-Modell auf dem Google Vertex AI- oder Amazon Bedrock-Dienst konfigurieren und dann die zusätzlichen Einstellungen im Extraktions-Bot konfigurieren, um diesen Anbieter zu verwenden. Einzelheiten finden Sie unter Aktion „Daten extrahieren“.

  7. Klicken Sie auf Weiter.

Wir empfehlen Ihnen, ein Beispieldokument neben dem Control Room-Fenster zu öffnen, während Sie die Formular- und Tabellenfelder konfigurieren.

Anmerkung:
  • Ein Formularfeld ist eine Art von Feld, das nur einmal in einem Dokument vorkommt.
  • Ein Tabellenfeld ist eine Art von Feld, das in einem Dokument immer wieder auftaucht, normalerweise in Form einer Tabelle.

  1. Konfigurieren Sie die Formular- und Tabellenfelder für die Extraktion. Weitere Details finden Sie unter Ansicht und Suchfelder.
    1. Klicken Sie auf ein Feld, um den Feldeditor zu öffnen. Weitere Details finden Sie unter Leitlinien zur Bearbeitung der Felder und Erstellung von benutzerdefinierten Aliasen.
    2. Fahren Sie mit der Maus über das Menüsymbol rechts neben einem Feld, um auf die Pfeile nach oben/unten zuzugreifen.
    3. Verwenden Sie die Pfeile, um die Reihenfolge der Felder für eine effizientere manuelle Validierung neu anzuordnen.
      Die Reihenfolge der Felder hat keinen Einfluss auf die Extraktion.
    Weitere Informationen zu den anderen Feldattributen finden Sie unter Überlegungen zu Formular- und Tabellenfeldern.
  2. Klicken Sie auf Feld hinzufügen und geben Sie die Felddetails an, wie Feldname, Feldbezeichnung, Zuverlässigkeit, Datentyp, Format für Datum/Zahl usw. Weitere Details finden Sie unter Überlegungen zu Formular- und Tabellenfeldern.
    Anmerkung: Wenn Sie die Option Generative KI-gesteuerte Datenextraktions ausgewählt haben, empfehlen wir, gute Eingabeaufforderungen für Felder hinzuzufügen, um die erwarteten Ergebnisse zu erzielen, wenn Sie die Lerneinheiten erstellen. Einzelheiten finden Sie unter Document Automation – Datenextraktion mit generative KI.
    Das folgende Bild zeigt Formular- und Tabellenfelder, die in einer Lerninstanz konfiguriert sind:
    Formularfelder einer Lerninstanz

    Tabellenfelder einer Lerninstanz und Hinzufügen einer benutzerdefinierten Tabelle auf Ebene der Lerninstanz
    Anmerkung: Die Option Feld hinzufügen ist für den Dokumenttyp Quittungen nicht verfügbar.
  3. Klicken Sie auf Erstellen.

Nächste Maßnahme

Laden Sie Dokumente in die Lerninstanz hoch, beheben Sie Validierungsfehler und überprüfen Sie die extrahierten Daten: Dokumente bearbeiten in Community Edition