Aktion „Regex-Extrahierung“ in Validierungsregeln verwenden

Mit der Aktion Regex-Extrahierung können Nutzer einen benutzerdefinierten regulären Ausdruck (Regex) auf die aus Dokumenten extrahierten Werte anwenden. Mit dieser Aktion können Nutzer die extrahierten Daten manipulieren, indem sie auf Grundlage des angegebenen Regex-Musters bestimmte Teilzeichenfolgen extrahieren.

Wenn ein Dokument verarbeitet und ein Wert extrahiert wird, können Sie die Aktion Regex-Extrahierung auf diesen Wert anwenden. Sie können ein Regex-Muster definieren, das verwendet wird, um einen bestimmten Teil des extrahierten Wertes zu identifizieren und zu extrahieren.
Anmerkung: Es wird nur die erste Übereinstimmung extrahiert, die auf Grundlage des angegebenen Regex-Musters im Wert gefunden wird.

Vorbereitungen

  • Wenn Sie die Aktion „Regex-Extrahierung“ anwenden, legt das System bei der Extraktion einen Feldwert mit der ersten Regex-Übereinstimmung fest.
  • Wenn der angegebene Regex keine Übereinstimmung mit dem Feld aufweist, wird ein leerer Feldwert zurückgegeben.
  • Wenn Sie kein aktualisiertes (v.31) Paket mit einer Lerninstanz verbunden haben, erhalten Sie eine Warnmeldung, die darauf hinweist, dass diese Regel möglicherweise nicht wie erwartet funktioniert.

Beispiel

Diese Funktion ist besonders nützlich in Szenarien, in denen nur ein Teil der extrahierten Daten benötigt wird. Beispiele sind das Extrahieren eines bestimmten Satzes von Zahlen aus einer größeren Zeichenkette, das Isolieren eines Teils einer Adresse oder das Abrufen eines bestimmten Fragments aus einer Tabellenbeschreibung.

Wenn Sie im folgenden Beispiel den Lieferantencode aus der Spalte Beschreibung des Dokuments extrahieren möchten, wird der gesamte Beschreibungstext aus der Spalte Beschreibung abgerufen.

Das folgende Bild zeigt Lieferantencode-Werte mit dem Regex-Extrahierungsprozess.

Vor der Anwendung der Aktion „Regex-Extrahierung“

In diesem Beispiel wird gezeigt, wie Sie nur den Lieferantencode aus der Spalte Beschreibung des Dokuments extrahieren.

Prozedur

  1. Klicken Sie auf der Registerkarte Feldregeln auf Regel hinzufügen.
  2. Geben Sie die Bedingung ist nicht leer für das Feld Lieferantencode an.
  3. Wählen Sie den Aktionstyp Regex-Extrahierung .
  4. Geben Sie das Regex-Muster an. Beispiel: Vendor Code: \d{6}
  5. Testen Sie das Regex-Muster, indem Sie den entsprechenden Wert für das angegebene Muster eingeben und auf Aktualisieren klicken. Zum Beispiel Vendor Code: 381823.
    Aktion „Regex-Extrahierung“ verwenden
  6. Klicken Sie auf Verarbeiten, um das Dokument zu verarbeiten.
    Basierend auf dem angegebenen Regex-Muster wird nur der Wert Lieferantencode aus der Spalte Beschreibung extrahiert.

    Das folgende Bild zeigt die Lieferantencode -Werte nach Anwendung der Aktion Regex-Extrahierung.

    Extraktion der Lieferantencodes mit der Aktion „Regex-Extrahierung“

    Im Folgenden finden Sie einige Beispiele für Regex-Muster, die Sie für die Extraktion verwenden können:
    Datumstyp Regex-Muster Beispiele
    Text oder Adresse \b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+.[A-Z|a-z]{2,}\b test@gmail.com
    \b\d{3}[-.]?\d{3}[-.]?\d{4}\b 123.456.7890 oder 123-456-7890
    Nummer ^\d{2}$ 12, 23 oder 99
    ^[0-9]+$ 123 oder 12434
    Datum \b\d{1,2}[/-]\d{1,2}[/-]\d{4}\b 12/31/2022 oder 02/07/2012
    ^\d{2}/\d{2}/\d{4}$ 28/02/2222
    Anmerkung: Diese Regex-Muster sind nicht fix, sondern können je nach den Anforderungen Ihres Anwendungsfalls variieren.