Lesen und beachten Sie die Automation Anywhere-Dokumentation

Automation 360

Inhalt schließen

Inhalte

Inhalt öffnen

Die action „Text extrahieren“ verwenden

  • Aktualisiert: 2022/06/28
    • Automation 360 v.x
    • Erstellen
    • RPA Workspace

Die action „Text extrahieren“ verwenden

Mit der action Text extrahieren können Sie Text aus einer PDF-Datei extrahieren und als Textdatei speichern.

Wichtig: Wenn die richtigen Schriftarten nicht in die PDF-Datei eingebettet sind, kann der Text durch die action Text extrahieren nicht korrekt extrahiert werden.

Prozedur

Gehen Sie wie folgt vor, um Text aus einer PDF-Datei zu extrahieren:

  1. Doppelklicken Sie in der Actions-Palette auf die action Text extrahieren oder ziehen Sie sie aus dem PDF-package.
  2. Im PDF-Pfadwählen Sie eine der folgenden Optionen, um den Speicherort der PDF-Datei anzugeben:
    • Control Room-Datei: Ermöglicht es Ihnen, eine PDF-Datei auszuwählen, die in einem Ordner im Verzeichnis Control Room.
    • Desktop-Profil: Ermöglicht Ihnen die Auswahl einer PDF-Datei, die auf Ihrem Gerät verfügbar ist.
    • Variable: Ermöglicht es Ihnen, die Dateivariable anzugeben, die den Speicherort der PDF-Datei enthält.
  3. Optional: In der Benutzer-Passwort oder Besitzer-Kennwort geben Sie ein Kennwort ein, um den Zugriff auf die verschlüsselte PDF-Datei zu beschränken.
    • Benutzer-Passwort: Erlauben Sie den Benutzern, bestimmte Operationen mit der verschlüsselten PDF-Datei durchzuführen.
    • Passwort des Eigentümers: Erlauben Sie den Benutzern, ein Kennwort zum Öffnen der Datei zu verwenden.
  4. Wählen Sie im Feld Texttyp eine der folgenden Optionen:
    • Nur Text: Damit können Sie den Text extrahieren und in eine Textdatei kopieren.

      Dies ähnelt dem Kopieren von Text aus einer PDF-Datei und Einfügen in eine Textdatei.

    • Strukturierter Text: Die ursprüngliche Formatierung des aus der PDF-Datei extrahierten Textes bleibt erhalten.
      Mit der Option Datenverlust reduzieren können Sie sicherstellen, dass der gesamte Text mit minimaler Zeichenüberlagerung extrahiert wird. Mit dieser Funktion wird die Anzahl der Zeichen, die von anderen Zeichen überlagert werden, reduziert.
      Anmerkung: Wenn Sie Text mit dieser Option extrahieren, kann der extrahierte Text zusätzliche Leerzeichen enthalten.
  5. Im Seitenbereich wählen Sie eine der folgenden Optionen:
    • Alle Seiten: Ermöglicht es Ihnen, alle Seiten der PDF-Datei als Bild zu speichern.
    • Seiten: Ermöglicht Ihnen die Eingabe der Seitenzahlen der Seiten, die Sie als Bild speichern möchten.
  6. Geben Sie im Feld Daten in Textdatei exportieren einen Namen und einen Speicherort für die Textdatei an.
    Anmerkung: Der Name der Textdatei muss die .txt-Erweiterung enthalten. Wenn der Dateiname zum Beispiel Juni_Quartal_Bericht lautet, ist die .txt-Erweiterung Juni_Quartal_Bericht.txt.
  7. Wählen Sie die Option Dateien mit demselben Namen überschreiben um vorhandene Dateien mit demselben Namen zu überschreiben.
    Anmerkung: Wenn diese Option nicht ausgewählt ist und der bot auf eine Datei mit demselben Namen am angegebenen Ort trifft, schlägt die bot fehlschlagen.
  8. Optional: Aus dem PDF-Eigenschaften einer Wörterbuchvariablen zuweisen eine Wörterbuchvariable aus, die die Dateieigenschaften enthalten soll.
    Weitere Informationen finden Sie unter Verwendung einer Wörterbuchvariable für PDF-Eigenschaften.
  9. Klicken Sie auf Speichern.
Feedback senden