Erstellen einer Lerninstanz in Document Automation

Beginnen Sie mit der Verarbeitung von Dokumenten, indem Sie eine Lerninstanz erstellen, um Daten aus verschiedenen unterstützten Dokumenttypen zu extrahieren. Eine Lerninstanz ist eine Struktur, die Informationen wie Dokumenttyp, Sprache, zu extrahierende Felder usw. enthält.

Vorbereitungen

  • Um eine Lerninstanz zu erstellen, müssen Sie ein a Learning instance creator -Nutzer sein. Einzelheiten finden Sie unter Document Automation Nutzer.
  • Für Dokumenttypen, die OCR unterstützen, lautet die Standard-OCR-Einstellung ABBYY FineReader Engine.Alternativ können Sie eine Lerninstanz erstellen, um Dokumente in Google Vision OCR zu verarbeiten.
  • Stellen Sie für den Dokumenttyp Standardformulare sicher, dass Sie ein nutzerdefiniertes Extraktionsmodell erstellt haben. Einzelheiten finden Sie unter Ein benutzerdefiniertes Extraktionsmodell mit Standardformulare erstellen.

In diesem Video sehen Sie den kompletten Erstellungsprozess einer Lerninstanz:

Prozedur

  1. Navigieren Sie auf der Control Room-Startseite zu KI > Document Automation und klicken Sie auf Lerninstanz erstellen.
  2. Geben Sie einen Namen und eine Beschreibung für die Lerninstanz ein.
    Document Automation lässt keine doppelten Namen für Lerninstanzen zu, daher muss der von Ihnen angegebene Name eindeutig sein.
  3. Wählen Sie einen geeigneten Dokumenttyp aus.
    Anmerkung: Verwenden Sie den Dokumenttyp Nutzerdefiniert, um Dokumente zu verarbeiten, die visuell Rechnungen ähneln, wie z. B. Bestellungen und Kundenaufträge, die Schlüssel-Wert-Paare und eine Tabellenstruktur enthalten. In diesem Dokumenttyp erstellen und konfigurieren Sie alle Formular- und Tabellenfelder.
  4. Wählen Sie die Sprache.
    Einzelheiten zu den in Document Automation unterstützten Sprachen finden Sie unter Unterstützte Sprachen in Document Automation.

    Wenn Sie einen Dokumenttyp auswählen, der bei der Konfiguration des Parsers in Schritt 3 verwendet wird, wird die bei der Parserkonfiguration ausgewählte Sprache automatisch ausgewählt. Außerdem werden in der Gebietsschema-Liste Sprachoptionen auf der Grundlage der automatisch ausgewählten Sprache angezeigt.

  5. Wählen Sie einen Anbieter aus.
    Wenn Sie in Schritt 4 „Englisch“ als Sprache ausgewählt haben, wird Automation Anywhere (vortrainiert) automatisch ausgewählt.

    Wenn Sie einen Dokumenttyp auswählen, der bei der Konfiguration des Parsers in Schritt 3 verwendet wird, wird der konfigurierte Parser (eines Drittanbieters) automatisch als Anbieter ausgewählt.

  6. Optional: Wählen Sie den OCR-Anbieter aus. Standardmäßig verarbeitet Document Automation Dokumente in ABBYY FineReader Engine.
    Nutzer mit einem Cloud Control Room können auswählen, ob sie Dokumente in Google Vision OCR verarbeiten wollen.
  7. Optional: Mit der Option Genauigkeit durch Validierung verbessern können Sie Feedback zur Verbesserung der Extraktionsergebnisse an das System senden. Weitere Informationen finden Sie unter Verbessern der Extraktionsgenauigkeit durch Validierung.
    Anmerkung: Die Option Genauigkeit durch Validierung verbessern ist nur für ausgewählte Dokumenttypen verfügbar.
  8. Optional: Wählen Sie die Option Generative KI-gesteuerte Datenextraktion, um die generative KI-Funktionen für die Extraktion zu nutzen. Weitere Informationen finden Sie unter Document Automation – Datenextraktion mit generative KI.
    Wählen Sie einen der folgenden generative KI-Anbieter aus:
    Anmerkung:
    • Um die Generative KI-gesteuerte Datenextraktion-Option zu verwenden, stellen Sie sicher, dass Sie die Dokumentenextraktion Paket Version 3.31.16 oder später verwenden. Einzelheiten finden Sie unter Dokumentenextraktion Paket-Updates.
    • Die Option Generative KI-gesteuerte Datenextraktion ist nur für ausgewählte Dokumenttypen verfügbar. Bei einigen Dokumenttypen ist die Option Generative KI-gesteuerte Datenextraktion standardmäßig aktiviert und kann nicht deaktiviert werden. Sie können bei diesen Dokumenttypen nur den generative KI-Anbieter auswählen.
    • Wenn Sie von einer früheren Version auf v.33 oder höher aktualisieren, wird Open AI als Standardanbieter für die Datenextraktion festgelegt.
    • Wenn Sie Anthropic als Datenextraktionsanbieter in einer Lerninstanz auswählen und die erforderlichen Einstellungen für Anthropic in dem entsprechenden Extraktions-Bot nicht konfigurieren, wird bei der Verarbeitung von Dokumenten ein Fehler angezeigt.
    • Wenn Sie den Anbieter Anthropic für eine Lerninstanz ausgewählt haben und die Einstellungen für Anthropic falsch konfiguriert oder einen anderen Anbieter in dem entsprechenden Extraktions-Botausgewählt haben, wird bei der Verarbeitung von Dokumenten ein Fehler angezeigt.
    • Wenn Sie Dokumente mit OpenAI verarbeitet haben und dann zu Anthropic für die Datenextraktion gewechselt haben, verwenden nur die Dokumente, die nach dem Wechsel zu Anthropic verarbeitet werden, Anthropic für die Datenextraktion. Für die bereits verarbeiteten Dokumente werden die Daten mit OpenAI extrahiert.
    • Open AI: OpenAI bietet Zugang zu den leistungsstarken Sprachmodellen von Open AI für die Erstellung von Inhalten, Zusammenfassungen, das Verstehen von Bildern, die semantische Suche und die Übersetzung von natürlicher Sprache in Code. Dieser Anbieter ist über eine eingebettete Lizenz (erfordert keine zusätzlichen Lizenzen) oder Bring Your Own License (BYOL) verfügbar. Wenn Sie BYOL verwenden, stellen Sie sicher, dass Sie die zusätzlichen Einstellungen für OpenAI in dem Extraktions-Bot konfigurieren, um diesen Anbieter zu verwenden. Einzelheiten finden Sie unter Aktion „Daten extrahieren“.
    • Anthropic: Sie können jetzt die Anthropic generative KI-Modelle über AWS und GCP für die Datenextraktion in Document Automation verwenden. Dieses Angebot bietet Ihnen die Flexibilität, das generative KI-Modell je nach Cloud-Anbieter auszuwählen, den Ihr Unternehmen zertifiziert hat.

      Anthropic bietet die folgenden Vorteile:

      • Effiziente Verarbeitung großer, unstrukturierter Dokumente
      • Kann Dokumente in englischer und anderen Sprachen bearbeiten
      • Verarbeitet Dokumente schneller und mit höherer Genauigkeit bei der Datenextraktion

      Wenn Sie BYOL nutzen, müssen Sie das Anthropic Claude-Modell auf dem Google Vertex AI- oder Amazon Bedrock-Dienst konfigurieren und dann die zusätzlichen Einstellungen im Extraktions-Bot konfigurieren, um diesen Anbieter zu verwenden. Einzelheiten finden Sie unter Aktion „Daten extrahieren“.

    Erstellen einer Lerninstanz in Document Automation
  9. Klicken Sie auf Weiter.

Wir empfehlen Ihnen, ein Beispieldokument neben dem Control Room-Fenster zu öffnen, während Sie die Formular- und Tabellenfelder konfigurieren.

Anmerkung:
  • Ein Formularfeld ist eine Art von Feld, das nur einmal in einem Dokument vorkommt.
  • Ein Tabellenfeld ist eine Art von Feld, das in einem Dokument immer wieder auftaucht, normalerweise in Form einer Tabelle.

  1. Konfigurieren Sie die Formular- und Tabellenfelder für die Extraktion. Weitere Details finden Sie unter .
    1. Klicken Sie auf ein Feld, um den Feldeditor zu öffnen. Weitere Details finden Sie unter .
    2. Fahren Sie mit der Maus über das Menüsymbol rechts neben einem Feld, um auf die Pfeile nach oben/unten zuzugreifen.
    3. Verwenden Sie die Pfeile, um die Reihenfolge der Felder für eine effizientere manuelle Validierung neu anzuordnen.
      Die Reihenfolge der Felder hat keinen Einfluss auf die Extraktion.
    Weitere Informationen zu den anderen Feldattributen finden Sie unter .
  2. Klicken Sie auf Feld hinzufügen und geben Sie die Felddetails an, wie Feldname, Feldbezeichnung, Zuverlässigkeit, Datentyp, Format für Datum/Zahl usw. Weitere Details finden Sie unter .
    Das folgende Bild zeigt Formular- und Tabellenfelder, die in einer Lerninstanz konfiguriert sind:
    Formularfelder einer Lerninstanz

    Tabellenfelder einer Lerninstanz und Hinzufügen einer benutzerdefinierten Tabelle auf Ebene der Lerninstanz
    Anmerkung: Die Option Feld hinzufügen ist für den Dokumenttyp Quittungen nicht verfügbar.
  3. Optional: Klicken Sie auf der Registerkarte Tabellenfelder auf das Symbol +, um eine benutzerdefinierte Tabelle auf Ebene der Lerninstanz hinzuzufügen.
    1. Geben Sie einen Namen für die Tabelle ein und klicken Sie auf Hinzufügen.
    2. Klicken Sie auf Feld hinzufügen und geben Sie die Felddetails an, wie Feldname, Feldbezeichnung, Zuverlässigkeit, Datentyp, Format für Datum/Zahl usw. Weitere Details finden Sie unter .
      Anmerkung: Sie können die benutzerdefinierte Tabelle auch während der Bearbeitung einer Lerninstanz hinzufügen und löschen.
    Die benutzerdefinierte Tabelle wird in der Dropdown-Liste Tabelle angezeigt.
    Auf Ebene der Lerninstanz erstellte und in der Dropdown-Liste angezeigte Tabelle

    Sie können die Felder aus benutzerdefinierten und Standardtabellen auch auf der Registerkarte Dokumentenregeln anzeigen, aber Sie können keine Felder aus allen verschiedenen Tabellen auswählen. Weitere Einzelheiten zur Unterstützung mehrerer Tabellen finden Sie unter .

  4. Klicken Sie auf Erstellen.
Wenn eine neue Lerninstanz erstellt wird, erstellt der Control Room einen Ordner mit dem gleichen Namen wie die Lerninstanz im Ordner Automatisierung > Prozesse des Dokumentarbeitsbereichs. Der Ordner enthält zwei Bots (Extraktion und Download), einen Prozess und ein Formular. Weitere Details finden Sie unter .

Nächste Maßnahme

Laden Sie Dokumente in die Lerninstanz hoch, beheben Sie Validierungsfehler und überprüfen Sie die extrahierten Daten: Dokumente bearbeiten in Document Automation