action „Extraktion strukturierter Daten“
- Zuletzt aktualisiert2026/02/20
action „Extraktion strukturierter Daten“
Nutzen Sie die neue action „Extraktion strukturierter Daten“, um strukturierte Datenblöcke aus Webanwendungen zu erfassen, die auf HTML-Technologie basieren. Während der Laufzeit erkennt der Recorder Objekte, die dem ausgewählten ähnlich sind, und ordnet sie in Zeilen an, während ihre untergeordneten Elemente als Spalten zugeordnet werden.
Voraussetzungen
Achten Sie darauf, dass Sie die Browser-Erweiterung (Version 4.1.0.0 oder höher) verwenden.
Aktions-Parameter
- Doppelklicken oder ziehen Sie .
- Geben Sie das Fenster an, in dem ein Objekt erfasst werden soll. Wählen Sie aus den Registerkarten Anwendung, Browser oder Variable.
- Anwendung: Auswahl aus einer Liste der derzeit aktiven Fenster. Diese Option zeigt eine Liste aller Anwendungs- und Browserfenster an, die auf dem Bot Creator-Gerät geöffnet sind.
- Browser: Wählen Sie aus einer Liste unterstützter Browser-Tabs wie Google Chrome und Chromium-basiertem Microsoft Edge aus.
- Variable: Auswahl einer vorhandenen Fenstervariable zur Titelangabe des Anwendungsfensters.
- Geben Sie das Fenster an, in dem ein Objekt erfasst werden soll.
- Klicken Sie auf Objekt erfassen.
Das ausgewählte Fenster wird angezeigt.
- Bewegen Sie die Maus über das angegebene Objekt, das ähnliche andere Elemente hat.
Um das Objekt wird ein rotes, rechteckiges Feld angezeigt.
- Klicken Sie auf das Objekt, um es zu erfassen.
- Überprüfen Sie die Tabelle Objekteigenschaften.Wichtig: Wir empfehlen Ihnen, Eigenschaften wie HTML-ID, Pfad sowie alle anderen Eigenschaften, die sich bei jeder Seite ändern können, abzuwählen. Beziehen Sie stattdessen Eigenschaften wie DOMXPath und CSS-Selektor ein.
- Wählen Sie aus dem Datenextraktionstyp entweder System oder Benutzerdefiniert aus.
- System: Dieser Modus erkennt und extrahiert automatisch wiederkehrende Datenmuster aus dem ausgewählten Abschnitt der Webseite. Es identifiziert häufige Felder wie Text, Bilder und Hyperlinks und strukturiert sie in Spalten. Dieser Modus ist ideal, wenn Sie schnell Standarddatenlayouts wie Produktlisten oder Tabellen extrahieren möchten, ohne jede Spalte manuell konfigurieren zu müssen.
-
Benutzerdefiniert: Der benutzerdefinierte Modus eignet sich am besten für komplexe oder nicht standardmäßige Seitenlayouts, die eine höhere Präzision erfordern. Er ist besonders nützlich, wenn das erfasste Element viele Unterelemente enthält, Sie jedoch nur einige wenige auswählen müssen. Zusätzlich stellt der benutzerdefinierte Modus sicher, dass die extrahierten Daten in einer festen, vordefinierten Anzahl von Spalten bleiben.Wählen Sie Benutzerdefinierte Extraktion ausführen, um alle Datenpunkte aus dem erfassten Objekt zu extrahieren, einschließlich des DOMXPath und seines Beispielwerts. Sie können dann die extrahierten Daten manuell konfigurieren oder verfeinern, XPath-Ausdrücke bearbeiten, Spalten umbenennen sowie Elemente nach Bedarf hinzufügen, entfernen oder neu anordnen. Der benutzerdefinierte Modus ist ideal für komplexe oder nicht standardisierte Seitenlayouts, bei denen eine höhere Präzision erforderlich ist.Wichtig: Die Verwendung einer Variablen im Tab Anwendung kann beim Ausführen einer benutzerdefinierten Extraktion einen Fehler verursachen. Wir empfehlen, dass Sie im Tab Anwendung das spezifische Fenster aus der Dropdown-Liste auswählen und die benutzerdefinierte Extraktion ausführen, ohne den Bot zu speichern.
- Wählen Sie im Feld Systemzeitüberschreitung einstellen entweder Basic oder Advanced aus.
-
Basic: Geben Sie einen Wert in das Feld Auf Systemantwort warten (in Sekunden) ein, um anzugeben, wie viele Sekunden der bot warten muss, bis das Objektsteuerelement im Anwendungsfenster angezeigt wird. Diese Wartezeit umfasst sowohl die Wartezeit für das Laden der Seite als auch für die Objektsuche.Anmerkung: Die für den bot angegebene Wartezeit, bis das Steuerelement im Anwendungsfenster erscheint, gilt nur, wenn das Fenster, in dem das Steuerelement vorhanden ist, existiert. Der Recorder sucht zuerst nach dem Anwendungsfenster und erst dann nach dem Objekt innerhalb dieses Fensters. Die Standardzeit für die Suche nach dem Fenster beträgt 30 Sekunden. Selbst wenn Sie also eine Wartezeit von 5 Sekunden angeben, wird standardmäßig 30 Sekunden gewartet, wenn das Fenster nicht vorhanden ist.
Wir empfehlen Ihnen, zunächst die Bedingung zu verwenden, eine Wartezeit von null Sekunden anzugeben und sicherzustellen, dass das Anwendungsfenster existiert. Wenn das Fenster vorhanden ist, verwenden Sie den Recorder, geben Sie eine Wartezeit von 5 Sekunden an und führen Sie den bot aus, um das Objekt zu erkennen.
-
Advanced: Mit dieser Option automatisieren Sie Websites, die ständig neu geladen und mit aktuellen Daten aktualisiert werden, wie z. B. eine Website mit Aktienkursen. Diese Websites werden technisch gesehen nie vollständig auf den Bildschirm geladen. In solchen Fällen muss der bot nicht warten, bis die Webseite vollständig geladen ist, und kann nach einer bestimmten Zeit direkt mit der Automatisierung der Webseite fortfahren.
Geben Sie im Feld Auf Browserantwort warten (in Sekunden) ein, wie viele Sekunden der bot warten muss, bis der Browser geladen wird. Wählen Sie eine der folgenden Optionen aus:
- Bot anhalten und eine Fehlermeldung anzeigen: Wenn die Webseite innerhalb der angegebenen Zeitspanne nicht vollständig geladen wurde, wählen Sie diese Option, um den bot anzuhalten und eine Fehlermeldung anzuzeigen.
- Überspringen und mit dem Objekt fortfahren: Wählen Sie diese Option, um direkt zu dem Objekt zu gelangen und es zu erfassen, auch wenn die Webseite noch nicht vollständig geladen ist.
Geben Sie einen Wert in das Feld Auf Objektantwort warten (in Sekunden) ein, um anzugeben, wie viele Sekunden der bot warten muss, bis das Objektsteuerelement im Anwendungsfenster angezeigt wird.
-
Die Seite verwendet Lazy Loading Wählen Sie diese Option für Seiten, auf denen Daten dynamisch geladen werden und weiterhin automatisch geladen werden. Zum Beispiel werden Elemente auf der Seite geladen, während Sie scrollen.
- Wiederholungsversuche: Geben Sie die Anzahl der Wiederholungsversuche ein, die Sie für die Überprüfung der neuen Daten benötigen.
- Wartezeit zwischen Wiederholungsversuchen: Geben Sie die Anzahl der Sekunden ein, die die Automatisierung zwischen den Wiederholungsversuchen warten soll.
-
Basic: Geben Sie einen Wert in das Feld Auf Systemantwort warten (in Sekunden) ein, um anzugeben, wie viele Sekunden der bot warten muss, bis das Objektsteuerelement im Anwendungsfenster angezeigt wird. Diese Wartezeit umfasst sowohl die Wartezeit für das Laden der Seite als auch für die Objektsuche.
- Erstellen Sie im Feld Ergebnis in einer Variablen speichern eine Data Table-Variable, um die Ausgabe zu speichern.
Die extrahierten Daten werden in einer Datentabelle gespeichert, in der ähnliche Objekte als Zeilen angeordnet sind und deren Unterelemente als Spalten dargestellt werden.
Bekanntes Verhalten des Produkts
- Nur Textinhalte werden während der Extraktion extrahiert. Tags wie img, input, select, button, script und style werden während der Extraktion übersprungen.
- Wenn Sie die Aktion verwenden, um die durch die strukturierte Datenerfassung generierten Daten mit der Aktion in einer CSV-Datei zu speichern, stellen Sie sicher, dass Sie UTF-8 als Codierung auswählen.
- Ähnliche Elemente innerhalb des Shadow DOM werden nicht unterstützt.
- Das System kann Objekte nicht finden, wenn das ursprünglich erfasste Objekt nicht verfügbar ist.
- Die sichere Aufzeichnung wird derzeit nicht unterstützt.