Überlegungen zum Erstellen einer Lerninstanz in Document Automation

Beachten Sie beim Erstellen einer Lerninstanz diese Überlegungen zu Formular- und Tabellenfeldern, Suchfeldern, zusätzlichen Informationen zum Ausgabeordner nach dem Erstellen einer Lerninstanz usw.

Ansicht und Suchfelder

Document Automation bietet einen Standardsatz von Formular- und Tabellenfeldern, von denen viele zunächst nicht sichtbar sind. Sie können nach einem Feld über den Feldnamen, die Feldbezeichnung oder den Datentyp suchen.

Um die vollständige Liste der Felder zu sehen, klicken Sie auf Nicht verwendete Felder anzeigen. Eine Demonstration finden Sie im folgenden Video:

Leitlinien zur Bearbeitung der Felder und Erstellung von benutzerdefinierten Aliasen

  • Sie können die meisten Attribute eines Feldes bearbeiten.
  • Sie können den Namen und die Standardaliase nicht bearbeiten. Document Automation weist Standardaliase, d. h. hartcodierte Schlüsselwörter, Standardfeldern zu, um die Extraktion zu erleichtern.
  • Sie können die Standard-Aliase nicht ändern oder löschen, aber Sie können Aliase im Feld benutzerdefinierte Aliase hinzufügen.

    Im folgenden Video sehen Sie eine Demonstration der Erstellung eines benutzerdefinierten Alias:

Überlegungen zu Formular- und Tabellenfeldern

In der folgenden Tabelle sind alle Feldnamen und die erforderlichen Werte aufgeführt, die in der Beschreibung anzugeben sind.
Option Beschreibung
Feldname Geben Sie einen Feldnamen ein, der mit einem alphabetischen Zeichen (A–Z oder a–z) beginnt.

In Standardfeldern ist der Feldname hartcodiert und kann nicht geändert werden.

Feldbezeichnung Geben Sie einen nutzerfreundlichen Namen ein, um Validatoren zu unterstützen.

Sie können beispielsweise die Steuernummer des Unternehmens in einen lokalisierten Namen umbenennen, z. B. USt-IdNr.

Die Feldbezeichnung hat keinen Einfluss auf die Extraktion.

Zuverlässigkeit Legen Sie einen Grenzwert fest, um potenzielle falsch-positive Werte zu reduzieren.

Zum Zeitpunkt der Verarbeitung weist die Document Automation-Engine jedem Feld in einem Dokument eine Punktzahl zu, die angibt, mit welcher Sicherheit die Daten korrekt extrahiert wurden. Wenn das Dokument Felder enthält, deren Bewertung unter dem Konfidenzgrenzwert liegt, wird das Dokument an die Validierungswarteschlange gesendet.

Wenn Sie einen hohen Zuverlässigkeitsgrenzwert eingeben, werden weniger Dokumente an die Validierungswarteschlange gesendet. Wenn Sie einen niedrigen Zuverlässigkeitsgrenzwert eingeben, werden weniger Dokumente an die Validierungswarteschlange gesendet.

Unterstützt Werte von 1 bis 100.

Datentyp Wählen Sie aus den folgenden Datentypen:
  • Adresse*: Verwenden Sie diesen Datentyp, wenn Sie Adressfelder aus Dokumenten extrahieren müssen. Das System ist darauf trainiert, verschiedene Adressfelder zu extrahieren. Die Verwendung dieses Datentyps weist das System an, Adressen aus Dokumenten zu erkennen und zu extrahieren.
  • Text: Verwenden Sie diesen Datentyp, wenn Sie Textfelder aus Dokumenten extrahieren müssen. Das System ist darauf trainiert, verschiedene Textfelder zu extrahieren, und die Verwendung dieses Datentyps weist das System an, Text aus Dokumenten zu erkennen und zu extrahieren.
  • Zahl: Verwenden Sie diesen Datentyp, wenn Sie numerische Felder aus Dokumenten extrahieren müssen. Das System ist darauf trainiert, verschiedene numerische Felder zu extrahieren, und die Verwendung dieses Datentyps weist das System an, Zahlen aus Dokumenten zu erkennen und zu extrahieren.
  • Datum: Verwenden Sie diesen Datentyp, wenn Sie Datumsfelder aus Dokumenten extrahieren müssen. Das System ist darauf trainiert, verschiedene Datumsformate zu extrahieren, und die Verwendung dieses Datentyps weist das System an, Daten aus Dokumenten zu erkennen und zu extrahieren.

Wenn die Daten im Feld nicht mit dem Datentyp übereinstimmen, wird das Dokument an die Validierungswarteschlange gesendet.

Document Automation unterstützt verschiedene Datums- und Zahlenformate.

* Wenn Sie eine Lerninstanz mit einem benutzerdefinierten Dokumenttyp konfigurieren, enthalten die Formularfelder den Datentyp „Adresse“, der die gesamte Struktur einer Adresse extrahiert.

Formatieren von Datum/Zahlen Legen Sie eine Standarddarstellung fest, um extrahierte Datumsangaben und Zahlen in ein bestimmtes Format zu konvertieren. Dies gewährleistet Konsistenz und Genauigkeit in Ihren Datenbanken und anderen Aufzeichnungssystemen.

Wenn Sie beispielsweise Datumsangaben auf MM/DD/YYYY standardisieren und ein verarbeitetes Dokument ein Datum enthält, das als 12 Feb 2023 angezeigt wird, formatiert die Lerninstanz das Datum zu 02/12/2023 um.

Wenn Sie die Standardisierung von Zahlen auf das englische Gebietsschema (Vereinigte Staaten) wählen und ein verarbeitetes Dokument eine Zahl enthält, die als 100,00 angezeigt wird, formatiert die Lerninstanz die Zahl zu 100.00 um.

Erforderlich Wählen Sie eine der folgenden Optionen aus:
  • Erforderlich: Das Feld darf nicht leer sein.
  • Optional: Das Feld kann leer sein oder nicht im Dokument vorhanden sein.
Verwenden Sie Validierungsfeedback, um die Genauigkeit zu verbessern. Deaktivieren oder aktivieren Sie das Validierungsfeedback für das Feld. Wenn Sie die Option Genauigkeit durch Validierung verbessern auf der Seite Lerninstanz erstellen auswählen, ist diese Option standardmäßig für alle Felder aktiviert. Wenn diese Option aktiviert ist, wird das für das Feld bereitgestellte Validierungsfeedback verwendet, um die Genauigkeit der Datenextraktion zu verbessern. Wenn Sie jedoch feststellen, dass ein Feldwert auch ohne Validierungsfeedback gemäß Ihren Anforderungen extrahiert wird oder wenn Sie alternative Lösungen wie ein vorab trainiertes Modell oder generative KI-Anbieter verwenden müssen, um die Datenextraktion zu verbessern, können Sie das Kontrollkästchen für diese Option deaktivieren, um das Validierungsfeedback für das Feld zu deaktivieren.
Anmerkung:
  • Validierungsfeedback kann nur auf der Lerninstanzebene gesperrt werden und ist für Formular- und Tabellenfelder nicht verfügbar.
  • Wenn das Validierungsfeedback auf der Ebene der Lerninstanz gesperrt ist, wird die Validierungsfeedbackoption auf Feldebene auf den schreibgeschützten Modus gesetzt, da das System kein Validierungsfeedback zur Verbesserung der Datengenauigkeit berücksichtigt. Um die Validierung auf Feldebene zu bearbeiten, müssen Sie die Validierungssperre für die Lerninstanz deaktivieren.
  • Wenn Sie die Validierungsrückmeldung für Tabellenfelder deaktivieren, werden solche Felder in der Option Erweiterte Trainingseinstellungen nicht angezeigt. Wenn Sie beispielsweise eine Spalte, Quantity, als die primäre Spalte in den Erweiterten Trainingseinstellungen auswählen möchten und das Validierungsfeedback für dieses Tabellenfeld deaktiviert ist, wird die Quantity-Spalte nicht in der Liste der Primärspalten angezeigt.
Standardaliase Für dieses Feld ist keine Aktion erforderlich. Document Automation weist Standardaliase, d. h. hartcodierte Schlüsselwörter, Standardfeldern zu, um die Extraktion zu erleichtern.
Benutzerdefinierte Aliase Zusätzliche Schlüsselwörter, die Document Automation das Auffinden des Feldes erleichtern. Fügen Sie beispielsweise länder- oder regionsspezifische Namen für Felder wie USt-IdNr als Alias in ein benutzerdefiniertes Feld für die Steuernummer des Unternehmens ein. Sie können bis zu 30 eindeutige benutzerdefinierte Aliasnamen hinzufügen.
Anmerkung: Benutzerdefinierte Aliasnamen müssen eindeutig sein. Sie können den Standard-Alias eines anderen Feldes nicht duplizieren. Ausnahme: Formularfelder können doppelte benutzerdefinierte Aliase als Tabellenfelder haben und umgekehrt.
Validierungsregeln Erstellen Sie je nach Datentyp Regeln unter Verwendung von Mustern, Formeln, Listen und Anweisungen wie „beginnt mit“ oder „endet mit“.

Validierung von Formeln | Regex-Mustervalidierung

Leitlinien zum Erstellen oder Bearbeiten der benutzerdefinierten Mehrfachtabelle in einer Lerninstanz

Bei der Erstellung oder Bearbeitung von Mehrfachtabellen auf Ebene der Lerninstanz sind folgende Punkte zu beachten:
  • Diese Funktion ist auf Dokumenttypen wie Automation Anywhere (vordefiniert), Automation Anywhere (benutzerdefiniert), das IQ BotDocument Automation – Paket Bridge“ und unstrukturiert (generative KI) anwendbar.
  • Sie können die Regeln nur für jeweils ein Tabellenfeld einrichten; sie können nicht für Felder eingerichtet werden, die zu verschiedenen Tabellen gehören.
  • Alle Feldnamen müssen eindeutig sein.
  • Erweiterte Trainingseinstellungen gilt für Mehrfachtabellen. Die Option funktioniert auf Basis der einzelnen Tabellen und nicht über alle Tabellen hinweg.
  • Sie können Lerninstanzen, die Mehrfachtabellen enthalten, importieren, exportieren und kopieren.
  • Sie können die benutzerdefinierte Tabelle löschen, die in der Lerninstanz erstellt wurde, doch die Standard-Tabelle kann nicht gelöscht werden.
  • Die maximale Zeichenanzahl für benutzerdefinierte Mehrfachtabellennamen beträgt 50 Zeichen bzw. 200 Zeichen für Spaltennamen.
  • Für das Feld Tabellenname sind nur alphanumerische Zeichen, Unterstriche, Leerzeichen und Bindestriche zulässig.
  • Sie können den Tabellennamen beim Erstellen oder Bearbeiten einer Lerninstanz nicht umbenennen.
  • Die Unterstützung von Mehrfachtabellen gilt nicht für die Dokumenttypen Standardformulare, Google Document AI, Konnossement, Frachtbrief, Ankunftsanzeige und Packliste.
  • Die Ausgabedatei (CSV) enthält alle Tabellenverweise (Standard- und benutzerdefinierte Mehrfachtabellen) im Format Tabellenname: Feldname.

Bots-Ausgabedatei und Ordnerstruktur

Wenn eine neue Lerninstanz erstellt wird, erstellt der Control Room einen Ordner mit dem gleichen Namen wie die Lerninstanz im Ordner Automatisierung > Dokumentarbeitsbereich. Der Ordner enthält zwei Bots (Extraktion und Download), einen Prozess und ein Formular.
Beispiel-Screenshot von Assets einer Lerninstanz
  • Prozess: Verwaltet den Prozess mithilfe von If/Else-Szenarien, in denen Document Automation-Daten aus hochgeladenen Dokumenten extrahiert, Nutzern Dokumente zur Validierung zugewiesen und die extrahierten Daten heruntergeladen werden. Weitere Informationen finden Sie unter Automation Co-Pilot für Geschäftsanwender-Prozess in Document Automation.
  • Extraktions-Bot: Extrahiert Daten aus definierten Feldern in den hochgeladenen Dokumenten.
  • Download-Bot: Lädt die extrahierten Daten in einen bestimmten Ordner auf dem Gerät oder im freigegebenen Netzwerk herunter.
  • Formular: Definiert die Eingabeparameter, die an den Prozess gesendet werden. Zu den Eingabeparametern gehören der Name der Lerninstanz, die hochgeladene Datei und der Pfad der Ausgabedatei.