Dokumentenextraktion Paket-Updates

Überprüfen Sie die Aktualisierungen in den veröffentlichten Versionen des Dokumentenextraktion-Pakets, z. B. neue und erweiterte Funktionen sowie Fehlerbehebungen und Einschränkungen. Auf der Seite sind außerdem die Veröffentlichungsdaten der einzelnen Versionen sowie die kompatiblen Control Room- und Bot-Agent-Versionen aufgeführt.

Zusammenfassung der Versionen

In der folgenden Tabelle sind die Versionen des Dokumentenextraktion-Pakets aufgeführt, die entweder zusammen mit einer Automation 360-Version oder als reine Paketversion veröffentlicht wurden (in absteigender Reihenfolge der Veröffentlichungsdaten). Klicken Sie auf den Versionslink, um Informationen über die Aktualisierungen in dieser Version des Pakets zu erhalten.
Version Veröffentlichungsdatum Versionstyp Bot-Agent-Version Control Room-Build
Dokumentenextraktion Paket-Updates 5. April 2024 Mit Automation 360 v.32 (On-Premises) 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 21. März 2024 Mit Automation 360 v.32 (Sandbox) 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 26. Januar 2024 Nur Paket; nach Automation 360 v.31 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 22. Dezember 2023 Nur Paket; nach Automation 360 v.31 (Sandbox) 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 6. Dezember 2023 Mit Automation 360 v.31 (Sandbox) 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 28. November 2023 Mit Automation 360 v.30 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 16. November 2023 Nur Paket; nach Automation 360 v.30 21,252 oder höher 19223 oder höher
3.30.24 21. September 2023 Nur Paket; nach Automation 360 v.30 (Sandbox) 21,252 oder höher 19223 oder höher
3.30.22 6. September 2023 Mit Automation 360 v.30 (Sandbox) 21,252 oder höher 19223 oder höher
Dokumentenextraktion Paket-Updates 21. August 2023 Nur Paket; ab Automation 360 v.29 21,98 oder höher 15345 oder höher
3.30.19 16. August 2023 Nur Paket; ab Automation 360 v.29 21,98 oder höher 15345 oder höher
Dokumentenextraktion Paket-Updates 17. Juli 2023 Nur Paket; nach Automation 360 v.29 21,98 oder höher 15345 oder höher
Dokumentenextraktion Paket-Updates 6. Juni 2023 Mit Automation 360 v.29 (Sandbox) 21,98 oder höher 15345 oder höher
Anmerkung:
  • Um ein einzelnes Paket herunterzuladen (aktualisiert in einer Automation 360-Version, in der Sie nur das Paket benötigen), verwenden Sie diese URL:

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • Für das Dokumentenextraktion-Paket ist die Benennungskonvention: bot-command-iqbot-extraction360-<version-number>-full.jar

    Beispiel: bot-command-iqbot-extraction360-3.31.22-full.jar

Detaillierte Schritte zum Herunterladen eines Pakets und zum manuellen Hinzufügen zum Control Room finden Sie unter Pakete zum Control Room hinzufügen.

3.32.23

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Nutzer können das Validierungsfeedback jetzt in ihrer Document Automation-Umgebung speichern, wenn der Proxy auf dem Bot-Agenten-Rechner aktiviert ist.

Service Cloud-Fall-ID: 02092484

Mit Google Vision OCR und aktiviertem Proxy schlägt die Dokumentenextraktion bei unstrukturierten Dokumenten nicht mehr fehl und es wird keine Fehlermeldung angezeigt.

Service Cloud-Fall-ID: 02104409

3.32.22

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Mit dem verbesserten Modell zur Erkennung von Dokumenttabellen (das den Tabellenende-Indikator hinzufügt) können Sie jetzt Tabellendaten aus allen Seiten für die ausgewählte Sprache extrahieren. Auf diese Weise werden Probleme mit fehlenden Tabellen und der Extraktion der letzten Zeilen von Seiten reduziert.

Service Cloud-Fall-ID: 02065073

Mit der verbesserten Tabellenextraktion zeigen unstrukturierte Tabellen nicht mehr die Junk-Werte an, sondern extrahieren nun erfolgreich die Tabellendaten.

3.31.22

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Nachdem der Lerninstanz ein Validierungsfeedback hinzugefügt wurde, schlägt die Dokumentextraktion nicht mehr mit einer Fehlermeldung fehl.

Zuvor schlug die Dokumentextraktion fehl, wenn das Kontrollkästchen für die Validierung aktiviert war.

Nach dem Hinzufügen von Validierungsfeedback zur Lerninstanz wird das Feedback für alle Tabellen auf allen Seiten des Dokuments gespeichert, und die Daten werden korrekt aus allen Seiten extrahiert.

Zuvor wurde das Feedback nicht für alle Seiten gespeichert.

Service Cloud-Fall-ID: 01995135, 02093575, 02093389

Nach dem Hinzufügen des Validierungs-Feedbacks werden jetzt, wenn die Tabellen-IDs übereinstimmen, Daten aus allen Tabellen jeder Seite extrahiert und im Validator angezeigt.

Zuvor wurden in solchen Fällen einige Seiten übersprungen, und im Validator wurden nicht die Daten von allen Seiten angezeigt.

Wenn Sie die erweiterten Trainingseinstellungen anwenden, müssen Sie die Spalten vertauschen, und alle Spaltenwerte müssen korrekt zugeordnet werden. Daraufhin werden die Daten korrekt in getrennte Spalten extrahiert. Sie können entweder alle Spaltenzellen erneut zuordnen oder alle anderen fehlerhaften Zellzeilen entfernen, während die ersten beiden Zeilen intakt bleiben. Es dürfen keine falschen Zellen in der Spalte vorhanden sein, und alle Zellen der Spalte müssen die richtigen Werte haben.

Bisher wurden in solchen Fällen die Daten aus zwei Spalten in eine einzige Spalte extrahiert.

Sie können jetzt die Werte der Tabellenfelder in der richtigen Reihenfolge extrahieren, und das Problem der Extraktion aus mehreren Zeilen tritt nicht mehr auf. Sie können auch die Funktion Tabellenende-Indikator dazu verwenden, Daten aus mehreren Zeilen zu extrahieren, nachdem Sie die Feedbackdaten angewendet haben, wenn nur eine einzige Zeile in der Tabelle vorhanden ist.
Anmerkung: Bei einzeiligen Tabellen ist es am besten, die Funktion Tabellenende-Indikator zu verwenden. Andernfalls kann die Extraktion in bestimmten Szenarien auch teilweise erfolgen.

Service Cloud-Fall-ID: 02091013

Wenn ein Dokument trainiert wurde und ein Nutzer dasselbe Dokument mit Google Vision OCR bearbeitet, wird das Feedback gespeichert, und die erforderlichen Daten werden extrahiert.

Bisher war es in solchen Fällen nicht möglich, einen bestimmten Dokumenttyp zu verarbeiten, und das Dokument musste jedes Mal manuell validiert werden.

Service Cloud-Fall-ID: 02098682

3.31.17

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Mit Google Vision OCR können Sie die Dokumente jetzt auch ohne Google Document AI-Lizenz erfolgreich bearbeiten. Es wird auch keine Fehlermeldung erzeugt.

Zuvor wurde für die Verarbeitung der Dokumente eine Google Document AI-Lizenz angefordert und beim Extrahieren der Dokumente ein Fehler erzeugt. Infolgedessen konnten Sie keine Dokumente mit Google Vision OCR extrahieren.

Service Cloud-Fall-ID: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Wenn Nutzer eine Lerninstanz mit Google Document AI (BYOK) und authentifiziertem Proxy erstellen, schlägt die Dokumentenextraktion bei Dokumenten mit mehr als 10 Seiten nicht mehr fehl.

Bisher schlug die Extraktion in solchen Fällen mit einer Fehlermeldung fehl und die Nutzer konnten die Dokumente nicht bearbeiten.

3.31.15

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Wenn Dokumentenregeln mehrere Bedingungen mit dem Operator UND mit (oder ohne) Gruppe enthalten, wird jetzt eine entsprechende Fehlermeldung angezeigt. Außerdem wird die entsprechende Aktion jetzt auf die Felder angewendet.

3.31.13

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Änderungen
Mit der verbesserten Extraktion von unstrukturierten Dokumenten in Document Automation können Sie:
  • Komplexe Abfragen effektiv verarbeiten
  • Dokumente mit verbesserter Navigation zur entsprechenden Seite validieren
Korrekturen
Mit der verbesserten Tabellenextraktion unter Verwendung der ABBYY OCR-Engine funktioniert das heuristische Feedback jetzt ordnungsgemäß.
  • Deutsche Version: Die Rechnungsextraktion funktioniert nach der Anwendung von Feedback korrekt und alle Tabellendaten werden extrahiert.
  • Spanische Version: Die Tabellendaten werden korrekt aus dem Rechnungsdokument extrahiert.
  • Englische Version: Die Rechnungsdaten werden aus allen Seiten mit ABBYY OCR extrahiert.

Service Cloud-Fall-ID: 01995901

Wenn ein Nutzer die Tabellendaten aus einer PDF-Datei extrahiert, in der die Tabelle auf mehrere Seiten erweitert ist, werden die Daten nach Anwendung des heuristischen Feedbacks aus allen Seiten erfolgreich extrahiert.

Bisher war es nicht möglich, Daten von der zweiten Seite der PDF-Datei zu extrahieren, wenn die Tabelle auf mehrere Seiten erweitert wurde.

Service Cloud-Fall-ID: 01996536

Beginnend mit der Extrahierung von der ersten Seite für alle Felder funktioniert das heuristische Feedback nun bei der Erfassung von mehrzeiligen Tabellendaten korrekt und erzeugt die richtige Ausgabe.

Zuvor wurden Daten aus mehrzeiligen Tabellen auch dann nicht extrahiert, wenn das heuristische Feedback bereitgestellt wurde. Infolgedessen wurde die Ausgabe nicht korrekt erzeugt.

Service Cloud-Fall-ID: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Bei Microsoft Standardformulare schlägt die Tabellenextraktion nicht mehr fehl, wenn die Zellen leer sind, und Nutzer können das Dokument erfolgreich extrahieren.
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, zeigt das extrahierte Dokument die korrekte Reihenfolge der Wörter für die Daten auf allen Seiten an.
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, werden alle Werte nach der Extraktion in der Tabelle angezeigt.

Bisher wurde in solchen Fällen die systemidentifizierte Region (SIR) hervorgehoben, aber in der Tabelle wurde ein leerer Wert angezeigt.

Wenn ein Nutzer eine .dw-Datei mit heuristischem Feedback importiert und ein Dokument verarbeitet, das in der letzten Zeile einen Negativwert enthält, werden die Dokumente korrekt extrahiert, ohne dass der Negativwert in der letzten Zeile übersprungen wird.

Bisher wurde in solchen Fällen die letzte Zeile übersprungen, was entweder zu Datenverlusten oder zu fehlerhafter Verarbeitung führte.

Wenn ein Nutzer ein Dokument verarbeitet, das eine Tabelle enthält, wird die Extraktion ohne die Fehlermeldung DOCUMENT_PARTIALLY_FAILED oder Extraction Timeout erfolgreich abgeschlossen.

Zuvor wurden in solchen Fällen einige Dokumente nicht extrahiert, weil mehrere Erkennungen aus derselben Tabelle vorlagen und ein Problem mit der Tabellengröße (max () arg) auftrat.

Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, werden alle Zeilen separat aus allen Seiten extrahiert.

Zuvor wurden die Zeilen der zweiten Seite in einer Zeile zusammengeführt.

Einschränkungen
Wenn ein Nutzer Google Vision OCR verwendet, funktioniert die Tabellenerkennung oder Extraktion nicht.

Problemumgehung: Es wird empfohlen, die ABBYY OCR-Engine zu verwenden.

Service Cloud-Fall-ID: 01995901

In bestimmten Fällen, in denen sich die Tabellen über mehrere Seiten erstrecken, ohne dass auf allen Seiten Header vorhanden sind (headerlose Seiten), stellen Nutzer möglicherweise fest, dass die Daten nach Anwendung des Feedbacks nicht aus allen Seiten extrahiert werden.

3.30.24

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Die Nutzer können nun die extrahierten Daten aus der zweiten Zeile korrekt anzeigen, indem sie das heuristische Feedback verwenden.
Für den Dokumenttyp Bestellung können Sie jetzt die Werte der Tabellenfelder korrekt aus allen Seiten extrahieren.
Die erstellte Feedbackdatei zeigt keine Fehlermeldung mehr an und die Nutzer können Dokumente erfolgreich verarbeiten.

3.30.22

  • Kompatible Bot-Agent-Version: 21,252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen
Document Automation bietet eine verbesserte Extraktion durch neue Dokumentendaten abrufen- und Dokumentendaten aktualisieren-Aktionen. Sie können diese Aktionen verwenden, um benutzerdefinierte Logik für die Datenmanipulation und -validierung anzuwenden, um das Straight-Through Processing (STP) zu maximieren und den manuellen Überprüfungsaufwand zu reduzieren.

3.30.21

  • Kompatible Bot-Agent-Version: 21,98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Korrekturen
Diese Dokumentenextraktion-Paketveröffentlichung ist ein Patch, um den Fehler „501: DOCUMENT_PARTIALLY_FAILED“ zu beheben, der bei der Verarbeitung einiger Dokumente aufgetreten ist.

3.30.19

  • Kompatible Bot-Agent-Version: 21,98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Korrekturen
Das Dokumentenextraktion-Paket bietet verbesserte Extraktionsmöglichkeiten für komplexe Tabellenkopfspalten.
  • Szenario 1: Extrahieren von Daten aus Tabellenkopfspalten mit mehreren Überschriften, die in einer einzigen Spalte zusammengefasst sind.
  • Szenario 2: Extrahieren von Daten aus Tabellenkopfspalten mit mehrfach geteilten Unterüberschriften.
Befolgen Sie diese Schritte, um die verbesserte Extraktion von Tabellenkopfdaten zu aktivieren:
  1. Erstellen oder bearbeiten Sie eine Lerninstanz.
  2. Um die Tabellenfelder hinzuzufügen oder zu bearbeiten, navigieren Sie zur Registerkarte Tabellenfelder und klicken Sie auf Feld hinzufügen > Feldeigenschaften.
  3. Fügen Sie jeden Tabellenkopf (Überschriften) als separates Tabellenfeld hinzu. Beispiel:

    Szenario 1: Fügen Sie den Spaltenkopf (Überschrift) und jede zusammengeführte Unterüberschrift als separates Tabellenfeld hinzu. Anhand der Bildschirmabbildung würden Sie Daten aus den drei zusammengeführten Spaltenkopffeldern extrahieren, für die Sie drei separate Tabellenfelder erstellen würden, wie CGST mit dem Alias CGST, SGST mit dem Alias SGST und CESS mit dem Alias CESS.

    Beispiel eines Spaltenkopfs mit mehreren Unterüberschriften.

    Szenario 2: Fügen Sie den Spaltenkopf und jede geteilte Unterüberschrift als separates Tabellenfeld hinzu. Ähnlich wie im obigen Beispiel müssten Sie für einen Spaltenkopf CGST mit aufgeteilten Unterüberschriften Rate und AMT zwei separate Tabellenfelder CGST Rate mit dem Alias CGST Rate und CGST AMT mit dem Alias CGST AMT erstellen.

    Beispiel eines Spaltenkopfs mit mehreren geteilten Unterüberschriften.

  4. Klicken Sie auf Absenden, um Ihre Änderungen zu speichern.

3.29.17

  • Kompatible Bot-Agent-Version: 21,98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Korrekturen
Das Dokumentenextraktionspaket enthält Korrekturen zur Verbesserung der Extraktion von Formular- und Tabellenfeldern.

3.29.14

  • Kompatible Bot-Agent-Version: 21,98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Neue Funktionen
Document Automation bietet eine verbesserte Extraktion durch heuristisches Feedback mit Schwerpunkt auf komplexen Szenarien, wie z. B. mehrzeilige oder mehrseitige Tabellen. Darüber hinaus gibt es Verbesserungen beim Extrahieren sowohl für Formularfelder als auch sofort einsetzbare Leistungsfunktionen (insbesondere für Tabellenfelder).