Überlegungen zum Erstellen einer Lerninstanz in Document Automation
- Zuletzt aktualisiert2024/10/31
Überlegungen zum Erstellen einer Lerninstanz in Document Automation
Beachten Sie beim Erstellen einer Lerninstanz diese Überlegungen zu Formular- und Tabellenfeldern, Suchfeldern, zusätzlichen Informationen zum Ausgabeordner nach dem Erstellen einer Lerninstanz usw.
Ansicht und Suchfelder
Document Automation bietet einen Standardsatz von Formular- und Tabellenfeldern, von denen viele zunächst nicht sichtbar sind. Sie können nach einem Feld über den Feldnamen, die Feldbezeichnung oder den Datentyp suchen.
Um die vollständige Liste der Felder zu sehen, klicken Sie auf Nicht verwendete Felder anzeigen. Eine Demonstration finden Sie im folgenden Video:
Leitlinien zur Bearbeitung der Felder und Erstellung von benutzerdefinierten Aliasen
- Sie können die meisten Attribute eines Feldes bearbeiten.
- Sie können den Namen und die Standardaliase nicht bearbeiten. Document Automation weist Standardaliase, d. h. hartcodierte Schlüsselwörter, Standardfeldern zu, um die Extraktion zu erleichtern.
- Sie können die Standard-Aliase nicht ändern oder löschen, aber Sie können Aliase im Feld benutzerdefinierte Aliase hinzufügen.
Im folgenden Video sehen Sie eine Demonstration der Erstellung eines benutzerdefinierten Alias:
Überlegungen zu Formular- und Tabellenfeldern
Option | Beschreibung |
---|---|
Feldname | Geben Sie einen Feldnamen ein, der mit einem alphabetischen Zeichen (A–Z oder a–z) beginnt. In Standardfeldern ist der Feldname hartcodiert und kann nicht geändert werden. |
Feldbezeichnung | Geben Sie einen nutzerfreundlichen Namen ein, um Validatoren zu unterstützen. Sie können beispielsweise die Steuernummer des Unternehmens in einen lokalisierten Namen umbenennen, z. B. USt-IdNr. Die Feldbezeichnung hat keinen Einfluss auf die Extraktion. |
Zuverlässigkeit | Legen Sie einen Grenzwert fest, um potenzielle falsch-positive Werte zu reduzieren. Zum Zeitpunkt der Verarbeitung weist die Document Automation-Engine jedem Feld in einem Dokument eine Punktzahl zu, die angibt, mit welcher Sicherheit die Daten korrekt extrahiert wurden. Wenn das Dokument Felder enthält, deren Bewertung unter dem Konfidenzgrenzwert liegt, wird das Dokument an die Validierungswarteschlange gesendet. Wenn Sie einen hohen Zuverlässigkeitsgrenzwert eingeben, werden weniger Dokumente an die Validierungswarteschlange gesendet. Wenn Sie einen niedrigen Zuverlässigkeitsgrenzwert eingeben, werden weniger Dokumente an die Validierungswarteschlange gesendet. Unterstützt Werte von Null bis 100. |
Datentyp | Wählen Sie aus
Adresse*,
Text, Nummer und Datum aus. Wenn die Daten im Feld nicht mit dem Datentyp übereinstimmen, wird das Dokument an die Validierungswarteschlange gesendet. Document Automation unterstützt verschiedene Datums- und Zahlenformate.* Wenn Sie eine Lerninstanz mit einem benutzerdefinierten Dokumenttyp konfigurieren, enthalten die Formularfelder den Datentyp „Adresse“, der die gesamte Struktur einer Adresse extrahiert. |
Formatieren von Datum/Zahlen | Legen Sie eine Standarddarstellung fest, um extrahierte Datumsangaben und Zahlen in ein bestimmtes Format zu konvertieren. Dies gewährleistet Konsistenz und Genauigkeit in Ihren Datenbanken und anderen Aufzeichnungssystemen. Wenn Sie beispielsweise Datumsangaben auf Wenn Sie die Standardisierung von Zahlen auf das englische Gebietsschema (Vereinigte Staaten) wählen und ein verarbeitetes Dokument eine Zahl enthält, die als |
Erforderlich | Wählen Sie eine der folgenden Optionen aus:
|
Verwenden Sie Validierungsfeedback, um die Genauigkeit zu verbessern. | Deaktivieren oder aktivieren Sie das Validierungsfeedback für das Feld. Wenn Sie die Option Genauigkeit durch Validierung verbessern auf der Seite Lerninstanz erstellen auswählen, ist diese Option standardmäßig für alle Felder aktiviert. Wenn diese Option aktiviert ist, wird das für das Feld bereitgestellte Validierungsfeedback verwendet, um die Genauigkeit der Datenextraktion zu verbessern. Wenn Sie jedoch feststellen, dass ein Feldwert auch ohne Validierungsfeedback gemäß Ihren Anforderungen extrahiert wird oder wenn Sie alternative Lösungen wie ein vorab trainiertes Modell oder generative KI-Anbieter verwenden müssen, um die Datenextraktion zu verbessern, können Sie das Kontrollkästchen für diese Option deaktivieren, um das Validierungsfeedback für das Feld zu deaktivieren. Anmerkung:
|
Standardaliase | Für dieses Feld ist keine Aktion erforderlich. Document Automation weist Standardaliase, d. h. hartcodierte Schlüsselwörter, Standardfeldern zu, um die Extraktion zu erleichtern. |
Benutzerdefinierte Aliase | Zusätzliche Schlüsselwörter, die Document Automation das Auffinden des Feldes erleichtern. Fügen Sie beispielsweise länder- oder regionsspezifische Namen für Felder wie USt-IdNr als Alias in ein benutzerdefiniertes Feld für die Steuernummer des Unternehmens ein. Sie können bis zu 30 eindeutige benutzerdefinierte Aliasnamen hinzufügen. Anmerkung: Benutzerdefinierte Aliasnamen müssen eindeutig sein. Sie können den Standard-Alias eines anderen Feldes nicht duplizieren. Ausnahme: Formularfelder können doppelte benutzerdefinierte Aliase als Tabellenfelder haben und umgekehrt.
|
Validierungsregeln | Erstellen Sie je nach Datentyp Regeln unter Verwendung von Mustern, Formeln, Listen und Anweisungen wie „beginnt mit“ oder „endet mit“. |
Leitlinien zum Erstellen oder Bearbeiten der benutzerdefinierten Mehrfachtabelle in einer Lerninstanz
- Diese Funktion ist auf Dokumenttypen wie Automation Anywhere (vordefiniert), Automation Anywhere (benutzerdefiniert), das IQ Bot „Document Automation – Paket Bridge“ und unstrukturiert (generative KI) anwendbar.
- Sie können die Regeln nur für jeweils ein Tabellenfeld einrichten; sie können nicht für Felder eingerichtet werden, die zu verschiedenen Tabellen gehören.
- Alle Feldnamen müssen eindeutig sein.
- Erweiterte Trainingseinstellungen gilt für Mehrfachtabellen. Die Option funktioniert auf Basis der einzelnen Tabellen und nicht über alle Tabellen hinweg.
- Sie können Lerninstanzen, die Mehrfachtabellen enthalten, importieren, exportieren und kopieren.
- Sie können die benutzerdefinierte Tabelle löschen, die in der Lerninstanz erstellt wurde, doch die Standard-Tabelle kann nicht gelöscht werden.
- Die maximale Zeichenanzahl für benutzerdefinierte Mehrfachtabellennamen beträgt 50 Zeichen bzw. 200 Zeichen für Spaltennamen.
- Für das Feld Tabellenname sind nur alphanumerische Zeichen, Unterstriche, Leerzeichen und Bindestriche zulässig.
- Sie können den Tabellennamen beim Erstellen oder Bearbeiten einer Lerninstanz nicht umbenennen.
- Die Unterstützung von Mehrfachtabellen gilt nicht für die Dokumenttypen Standardformulare, Google Document AI, Konnossement, Frachtbrief, Ankunftsanzeige und Packliste.
- Die Ausgabedatei (CSV) enthält alle Tabellenverweise (Standard- und benutzerdefinierte Mehrfachtabellen) im Format Tabellenname: Feldname.
Bots-Ausgabedatei und Ordnerstruktur
- Prozess: Verwaltet den Prozess mithilfe von If/Else-Szenarien, in denen Document Automation-Daten aus hochgeladenen Dokumenten extrahiert, Nutzern Dokumente zur Validierung zugewiesen und die extrahierten Daten heruntergeladen werden. Weitere Informationen finden Sie unter Automation Co-Pilot für Geschäftsanwender-Prozess in Document Automation.
- Extraktions-Bot: Extrahiert Daten aus definierten Feldern in den hochgeladenen Dokumenten.
- Download-Bot: Lädt die extrahierten Daten in einen bestimmten Ordner auf dem Gerät oder im freigegebenen Netzwerk herunter.
- Formular: Definiert die Eingabeparameter, die an den Prozess gesendet werden. Zu den Eingabeparametern gehören der Name der Lerninstanz, die hochgeladene Datei und der Pfad der Ausgabedatei.