Dokumentenextraktion Paket-Updates
- Aktualisiert: 2024/04/18
Dokumentenextraktion Paket-Updates
Überprüfen Sie die Aktualisierungen in den veröffentlichten Versionen des Dokumentenextraktion-Pakets, z. B. neue und erweiterte Funktionen sowie Fehlerbehebungen und Einschränkungen. Auf der Seite sind außerdem die Veröffentlichungsdaten der einzelnen Versionen sowie die kompatiblen Control Room- und Bot-Agent-Versionen aufgeführt.
Zusammenfassung der Versionen
In der folgenden Tabelle sind die Versionen des Dokumentenextraktion-Pakets aufgeführt, die entweder zusammen mit einer Automation 360-Version oder als reine Paketversion veröffentlicht wurden (in absteigender Reihenfolge der Veröffentlichungsdaten). Klicken Sie auf den Versionslink, um Informationen über die Aktualisierungen in dieser Version des Pakets zu erhalten.Version | Veröffentlichungsdatum | Versionstyp | Bot-Agent-Version | Control Room-Build |
---|---|---|---|---|
Dokumentenextraktion Paket-Updates | 5. April 2024 | Mit Automation 360 v.32 (On-Premises) | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 21. März 2024 | Mit Automation 360 v.32 (Sandbox) | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 26. Januar 2024 | Nur Paket; nach Automation 360 v.31 | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 22. Dezember 2023 | Nur Paket; nach Automation 360 v.31 (Sandbox) | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 6. Dezember 2023 | Mit Automation 360 v.31 (Sandbox) | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 28. November 2023 | Mit Automation 360 v.30 | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 16. November 2023 | Nur Paket; nach Automation 360 v.30 | 21,252 oder höher | 19223 oder höher |
3.30.24 | 21. September 2023 | Nur Paket; nach Automation 360 v.30 (Sandbox) | 21,252 oder höher | 19223 oder höher |
3.30.22 | 6. September 2023 | Mit Automation 360 v.30 (Sandbox) | 21,252 oder höher | 19223 oder höher |
Dokumentenextraktion Paket-Updates | 21. August 2023 | Nur Paket; ab Automation 360 v.29 | 21,98 oder höher | 15345 oder höher |
3.30.19 | 16. August 2023 | Nur Paket; ab Automation 360 v.29 | 21,98 oder höher | 15345 oder höher |
Dokumentenextraktion Paket-Updates | 17. Juli 2023 | Nur Paket; nach Automation 360 v.29 | 21,98 oder höher | 15345 oder höher |
Dokumentenextraktion Paket-Updates | 6. Juni 2023 | Mit Automation 360 v.29 (Sandbox) | 21,98 oder höher | 15345 oder höher |
- Um ein einzelnes Paket herunterzuladen (aktualisiert in einer Automation 360-Version, in der Sie nur das Paket benötigen), verwenden Sie diese URL:
https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar
- Für das Dokumentenextraktion-Paket ist die Benennungskonvention:
bot-command-iqbot-extraction360-<version-number>-full.jar
Beispiel:
bot-command-iqbot-extraction360-3.31.22-full.jar
Detaillierte Schritte zum Herunterladen eines Pakets und zum manuellen Hinzufügen zum Control Room finden Sie unter Pakete zum Control Room hinzufügen.
3.32.23
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Nutzer können das Validierungsfeedback jetzt in ihrer Document Automation-Umgebung speichern, wenn der Proxy auf dem Bot-Agenten-Rechner aktiviert ist. Service Cloud-Fall-ID: 02092484 |
Mit Google Vision OCR und aktiviertem Proxy schlägt die Dokumentenextraktion bei unstrukturierten Dokumenten nicht mehr fehl und es wird keine Fehlermeldung angezeigt. Service Cloud-Fall-ID: 02104409 |
3.32.22
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Mit dem verbesserten Modell zur Erkennung von Dokumenttabellen (das den Tabellenende-Indikator hinzufügt) können Sie jetzt Tabellendaten aus allen Seiten für die ausgewählte Sprache extrahieren. Auf diese Weise werden Probleme mit fehlenden Tabellen und der Extraktion der letzten Zeilen von Seiten reduziert. Service Cloud-Fall-ID: 02065073 |
Mit der verbesserten Tabellenextraktion zeigen unstrukturierte Tabellen nicht mehr die Junk-Werte an, sondern extrahieren nun erfolgreich die Tabellendaten. |
3.31.22
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Nachdem der Lerninstanz ein Validierungsfeedback hinzugefügt wurde, schlägt die Dokumentextraktion nicht mehr mit einer Fehlermeldung fehl. Zuvor schlug die Dokumentextraktion fehl, wenn das Kontrollkästchen für die Validierung aktiviert war. |
Nach dem Hinzufügen von Validierungsfeedback zur Lerninstanz wird das Feedback für alle Tabellen auf allen Seiten des Dokuments gespeichert, und die Daten werden korrekt aus allen Seiten extrahiert. Zuvor wurde das Feedback nicht für alle Seiten gespeichert. Service Cloud-Fall-ID: 01995135, 02093575, 02093389 |
Nach dem Hinzufügen des Validierungs-Feedbacks werden jetzt, wenn die Tabellen-IDs übereinstimmen, Daten aus allen Tabellen jeder Seite extrahiert und im Validator angezeigt. Zuvor wurden in solchen Fällen einige Seiten übersprungen, und im Validator wurden nicht die Daten von allen Seiten angezeigt. |
Wenn Sie die erweiterten Trainingseinstellungen anwenden, müssen Sie die Spalten vertauschen, und alle Spaltenwerte müssen korrekt zugeordnet werden. Daraufhin werden die Daten korrekt in getrennte Spalten extrahiert. Sie können entweder alle Spaltenzellen erneut zuordnen oder alle anderen fehlerhaften Zellzeilen entfernen, während die ersten beiden Zeilen intakt bleiben. Es dürfen keine falschen Zellen in der Spalte vorhanden sein, und alle Zellen der Spalte müssen die richtigen Werte haben. Bisher wurden in solchen Fällen die Daten aus zwei Spalten in eine einzige Spalte extrahiert. |
Sie können jetzt die Werte der Tabellenfelder in der richtigen Reihenfolge extrahieren, und das Problem der Extraktion aus mehreren Zeilen tritt nicht mehr auf. Sie können auch die Funktion Tabellenende-Indikator dazu verwenden, Daten aus mehreren Zeilen zu extrahieren, nachdem Sie die Feedbackdaten angewendet haben, wenn nur eine einzige Zeile in der Tabelle vorhanden ist. Anmerkung: Bei einzeiligen Tabellen ist es am besten, die Funktion Tabellenende-Indikator zu verwenden. Andernfalls kann die Extraktion in bestimmten Szenarien auch teilweise erfolgen. Service Cloud-Fall-ID: 02091013 |
Wenn ein Dokument trainiert wurde und ein Nutzer dasselbe Dokument mit Google Vision OCR bearbeitet, wird das Feedback gespeichert, und die erforderlichen Daten werden extrahiert. Bisher war es in solchen Fällen nicht möglich, einen bestimmten Dokumenttyp zu verarbeiten, und das Dokument musste jedes Mal manuell validiert werden. Service Cloud-Fall-ID: 02098682 |
3.31.17
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Mit Google Vision OCR können Sie die Dokumente jetzt auch ohne Google Document AI-Lizenz erfolgreich bearbeiten. Es wird auch keine Fehlermeldung erzeugt. Zuvor wurde für die Verarbeitung der Dokumente eine Google Document AI-Lizenz angefordert und beim Extrahieren der Dokumente ein Fehler erzeugt. Infolgedessen konnten Sie keine Dokumente mit Google Vision OCR extrahieren. Service Cloud-Fall-ID: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573 |
3.31.16
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Wenn Nutzer eine Lerninstanz mit Google Document AI (BYOK) und authentifiziertem Proxy erstellen, schlägt die Dokumentenextraktion bei Dokumenten mit mehr als 10 Seiten nicht mehr fehl. Bisher schlug die Extraktion in solchen Fällen mit einer Fehlermeldung fehl und die Nutzer konnten die Dokumente nicht bearbeiten. |
3.31.15
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Wenn Dokumentenregeln mehrere Bedingungen mit dem Operator UND mit (oder ohne) Gruppe enthalten, wird jetzt eine entsprechende Fehlermeldung angezeigt. Außerdem wird die entsprechende Aktion jetzt auf die Felder angewendet. |
3.31.13
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Änderungen |
---|
Mit der verbesserten Extraktion von unstrukturierten Dokumenten in Document Automation können Sie:
|
Korrekturen |
---|
Mit der verbesserten Tabellenextraktion unter Verwendung der ABBYY OCR-Engine funktioniert das heuristische Feedback jetzt ordnungsgemäß.
Service Cloud-Fall-ID: 01995901 |
Wenn ein Nutzer die Tabellendaten aus einer PDF-Datei extrahiert, in der die Tabelle auf mehrere Seiten erweitert ist, werden die Daten nach Anwendung des heuristischen Feedbacks aus allen Seiten erfolgreich extrahiert. Bisher war es nicht möglich, Daten von der zweiten Seite der PDF-Datei zu extrahieren, wenn die Tabelle auf mehrere Seiten erweitert wurde. Service Cloud-Fall-ID: 01996536 |
Beginnend mit der Extrahierung von der ersten Seite für alle Felder funktioniert das heuristische Feedback nun bei der Erfassung von mehrzeiligen Tabellendaten korrekt und erzeugt die richtige Ausgabe. Zuvor wurden Daten aus mehrzeiligen Tabellen auch dann nicht extrahiert, wenn das heuristische Feedback bereitgestellt wurde. Infolgedessen wurde die Ausgabe nicht korrekt erzeugt. Service Cloud-Fall-ID: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090 |
Bei Microsoft Standardformulare schlägt die Tabellenextraktion nicht mehr fehl, wenn die Zellen leer sind, und Nutzer können das Dokument erfolgreich extrahieren. |
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, zeigt das extrahierte Dokument die korrekte Reihenfolge der Wörter für die Daten auf allen Seiten an. |
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, werden alle Werte nach der Extraktion in der Tabelle angezeigt. Bisher wurde in solchen Fällen die systemidentifizierte Region (SIR) hervorgehoben, aber in der Tabelle wurde ein leerer Wert angezeigt. |
Wenn ein Nutzer eine .dw-Datei mit heuristischem Feedback importiert und ein Dokument verarbeitet, das in der letzten Zeile einen Negativwert enthält, werden die Dokumente korrekt extrahiert, ohne dass der Negativwert in der letzten Zeile übersprungen wird. Bisher wurde in solchen Fällen die letzte Zeile übersprungen, was entweder zu Datenverlusten oder zu fehlerhafter Verarbeitung führte. |
Wenn ein Nutzer ein Dokument verarbeitet, das eine Tabelle enthält, wird die Extraktion ohne die Fehlermeldung DOCUMENT_PARTIALLY_FAILED oder Extraction Timeout erfolgreich abgeschlossen. Zuvor wurden in solchen Fällen einige Dokumente nicht extrahiert, weil mehrere Erkennungen aus derselben Tabelle vorlagen und ein Problem mit der Tabellengröße (max () arg) auftrat. |
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, werden alle Zeilen separat aus allen Seiten extrahiert. Zuvor wurden die Zeilen der zweiten Seite in einer Zeile zusammengeführt. |
Einschränkungen |
---|
Wenn ein Nutzer Google Vision OCR verwendet, funktioniert die Tabellenerkennung oder Extraktion nicht. Problemumgehung: Es wird empfohlen, die ABBYY OCR-Engine zu verwenden. Service Cloud-Fall-ID: 01995901 |
In bestimmten Fällen, in denen sich die Tabellen über mehrere Seiten erstrecken, ohne dass auf allen Seiten Header vorhanden sind (headerlose Seiten), stellen Nutzer möglicherweise fest, dass die Daten nach Anwendung des Feedbacks nicht aus allen Seiten extrahiert werden. |
3.30.24
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Korrekturen |
---|
Die Nutzer können nun die extrahierten Daten aus der zweiten Zeile korrekt anzeigen, indem sie das heuristische Feedback verwenden. |
Für den Dokumenttyp Bestellung können Sie jetzt die Werte der Tabellenfelder korrekt aus allen Seiten extrahieren. |
Die erstellte Feedbackdatei zeigt keine Fehlermeldung mehr an und die Nutzer können Dokumente erfolgreich verarbeiten. |
3.30.22
- Kompatible Bot-Agent-Version: 21,252 oder höher
- Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen |
---|
Document Automation bietet eine verbesserte Extraktion durch neue Dokumentendaten abrufen- und Dokumentendaten aktualisieren-Aktionen. Sie können diese Aktionen verwenden, um benutzerdefinierte Logik für die Datenmanipulation und -validierung anzuwenden, um das Straight-Through Processing (STP) zu maximieren und den manuellen Überprüfungsaufwand zu reduzieren. |
3.30.21
- Kompatible Bot-Agent-Version: 21,98 oder höher
- Kompatible Control Room-Version: 15345 oder höher
Korrekturen |
---|
Diese Dokumentenextraktion-Paketveröffentlichung ist ein Patch, um den Fehler „501: DOCUMENT_PARTIALLY_FAILED“ zu beheben, der bei der Verarbeitung einiger Dokumente aufgetreten ist. |
3.30.19
- Kompatible Bot-Agent-Version: 21,98 oder höher
- Kompatible Control Room-Version: 15345 oder höher
Korrekturen |
---|
Das Dokumentenextraktion-Paket bietet verbesserte Extraktionsmöglichkeiten für komplexe Tabellenkopfspalten.
Befolgen Sie diese Schritte, um die verbesserte Extraktion von Tabellenkopfdaten zu aktivieren:
|
3.29.17
- Kompatible Bot-Agent-Version: 21,98 oder höher
- Kompatible Control Room-Version: 15345 oder höher
Korrekturen |
---|
Das Dokumentenextraktionspaket enthält Korrekturen zur Verbesserung der Extraktion von Formular- und Tabellenfeldern. |
3.29.14
- Kompatible Bot-Agent-Version: 21,98 oder höher
- Kompatible Control Room-Version: 15345 oder höher
Neue Funktionen |
---|
Document Automation bietet eine verbesserte Extraktion durch heuristisches Feedback mit Schwerpunkt auf komplexen Szenarien, wie z. B. mehrzeilige oder mehrseitige Tabellen. Darüber hinaus gibt es Verbesserungen beim Extrahieren sowohl für Formularfelder als auch sofort einsetzbare Leistungsfunktionen (insbesondere für Tabellenfelder). |