Dokumentenextraktion Paket-Updates

Überprüfen Sie die Aktualisierungen in den veröffentlichten Versionen des Dokumentenextraktion Paket-s, z.B. neue und erweiterte Funktionen sowie Fehlerbehebungen und Einschränkungen. Auf der Seite sind außerdem die Veröffentlichungsdaten der einzelnen Versionen sowie die kompatiblen Control Room- und Bot-Agent-Versionen aufgeführt.

Zusammenfassung der Versionen

In der folgenden Tabelle sind die Versionen des Dokumentenextraktion Paket-s aufgeführt, die entweder zusammen mit einer Automation 360-Version oder als reine Paketversion veröffentlicht wurden (in absteigender Reihenfolge der Veröffentlichungsdaten). Klicken Sie auf den Versionslink, um Informationen über die Aktualisierungen in dieser Version des Pakets zu erhalten.
Version Veröffentlichungsdatum Versionstyp Bot-Agent-Version Control Room-Build
17. März 2025 Nur Paket; Veröffentlichung nach Automation 360 v.36 (Sandbox) 21.252 oder höher 19223 oder höher
5. März 2025 Mit Automation 360 v.36 (Sandbox) 21.252 oder höher 19223 oder höher
15. Januar 2025 Nur Paket; nach Automation 360 v.35 21.252 oder höher 19223 oder höher
26. November 2024 Mit Automation 360 v.35 (Sandbox) 21.252 oder höher 19223 oder höher
27. September 2024 Mit Automation 360 v.34 (Sandbox) 21.252 oder höher 19223 oder höher
15. Juli 2024 Nur Paket; nach Automation 360 v.33 21.252 oder höher 19223 oder höher
14. Juni 2024 Nur Paket; nach Automation 360 v.32 21.252 oder höher 19223 oder höher
26. Juni 2024 Mit Automation 360 v.33 (Lokal) 21.252 oder höher 19223 oder höher
18. April 2024 Nur Paket; nach Automation 360 v.32 21.252 oder höher 19223 oder höher
5. April 2024 Mit Automation 360 v.32 (Lokal) 21.252 oder höher 19223 oder höher
21. März 2024 Mit Automation 360 v.32 (Sandbox) Veröffentlichung 21.252 oder höher 19223 oder höher
26. Januar 2024 Nur Paket; nach Automation 360 v.31 21.252 oder höher 19223 oder höher
22. Dezember 2023 Nur Paket; nach Automation 360 v.31 (Sandbox) 21.252 oder höher 19223 oder höher
6. Dezember 2023 Mit Automation 360 v.31 (Sandbox) Veröffentlichung 21.252 oder höher 19223 oder höher
28. November 2023 Mit Automation 360 v.30 21.252 oder höher 19223 oder höher
16. November 2023 Nur Paket; nach Automation 360 v.30 21.252 oder höher 19223 oder höher
3.30.24 21. September 2023 Nur Paket; nach Automation 360 v.30 (Sandbox) 21.252 oder höher 19223 oder höher
3.30.22 6. September 2023 Mit Automation 360 v.30 (Sandbox) 21.252 oder höher 19223 oder höher
21. August 2023 Nur Paket; ab Automation 360 v.29 21.98 oder höher 15345 oder höher
3.30.19 16. August 2023 Nur Paket; ab Automation 360 v.29 21.98 oder höher 15345 oder höher
17. Juli 2023 Nur Paket; nach Automation 360 v.29 21.98 oder höher 15345 oder höher
6. Juni 2023 Mit Automation 360 v.29 (Sandbox) 21.98 oder höher 15345 oder höher
Anmerkung:
  • Um ein einzelnes Paket herunterzuladen (aktualisiert in einer Automation 360-Version, in der Sie nur das Paket benötigen), verwenden Sie diese URL:

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • Für Dokumentenextraktion Paket ist die Benennungskonvention: bot-command-iqbot-extraction360-<version-number>-full.jar

    Zum Beispiel, bot-command-iqbot-extraction360-3.31.22-full.jar

Detaillierte Schritte zum Herunterladen eines Pakets und zum manuellen Hinzufügen zum Control Room finden Sie unter Pakete zum Control Room hinzufügen.

3.36.10

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen
Erweiterte Datenextraktion mit Eingabeaufforderungs-Tag

Der @AdvancedExtraction-Eingabeaufforderungs-Tag wird eingeführt, um erweiterte, visuell unterstützte generative KI-Modelle für eine bessere Datenextraktion zu verwenden. Sie müssen dieses Tag pro Tabelle am Ende eines Tabellenfelds oder in der Tabellen-Eingabeaufforderung hinzufügen, um Vision-gestützte generative KI-Modelle für die Datenextraktion zu verwenden.

Verwenden von Eingabeaufforderungs-Tags in Eingabeaufforderungen für generative KI

Änderungen
Verbessertes Tabellenextraktionsmodell

Das Tabellenextraktionsmodell wurde aktualisiert, um Daten aus Tabellen-Headern und Tabellenfeldern zu extrahieren und die Datenextraktion aus Tabellen mithilfe von Validierungsfeedback zu verbessern.

Einschränkungen
Sie können „Bring Your Own License (BYOL)“ für das OpenAI 01-mini-generative KI-Modell nicht konfigurieren und verwenden.

3.36.7

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen
Unterstützung für den Testmodus und PDFBox-Funktionen

Dokumentenextraktion-Paket unterstützt den Testmodus und PDFBox-Funktionen.

Lerninstanzen testen | Erstellen einer Lerninstanz in Document Automation

3.35.14

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen
Datenextraktion mithilfe von visuell unterstützten generative KI-Modellen

Vision-gestützte generative KI-Modelle sind in Document Automation integriert, um Dokumente mit visuell komplexen Strukturen zu verarbeiten, wie etwa zum Erkennen von Kontrollkästchen und Unterschriften.

Vision-gestützte generative KI-Modelle bieten die folgenden Vorteile:

Nahtlose Datenextraktion
Extrahiert Daten aus komplexen Tabellen mit verschachtelten Zeilen, zusammengeführten Spalten und Abschnitten. Erkennt und erfasst Auswahlelemente wie Kontrollkästchen.
Entwickelt für reale Anwendungsfälle
Bewältigt Herausforderungen bei der Extraktion von Daten aus verschiedenen Dokumenttypen wie Rechnungen, Bestellungen, Gesundheitsdokumenten und Lieferkettenunterlagen.
Mühelose Einrichtung
Verwendet vortrainierte Modelle, die sofort einsatzbereit sind, wobei Suchanfragen genutzt werden, um Informationen zu identifizieren und zu extrahieren.

Vision-gestützte Datenerfassung über generative KI | Verwenden von Eingabeaufforderungs-Tags in Eingabeaufforderungen für generative KI

Änderungen
Verbesserte Genauigkeit der Datenextraktion (Service Cloud-Fall-ID: 02113080)

Die Genauigkeit der Datenextraktion mithilfe der Funktion „Daten extrahieren“ Aktion wird verbessert, wenn Sie Vision-gestützte generative KI-Modelle verwenden. Einzelheiten finden Sie unter Vision-gestützte Datenerfassung über generative KI.

Verbessertes Tabellenextraktionsmodell (Service Cloud-Fall-ID: 02159567, 02154057, 02145073, 02163032, 02151987, 02175105)

Das Tabellenextraktionsmodell wird aktualisiert, um Dokumente mit komplexen Headern in Tabellen zu verarbeiten und Daten aus Tabellen von allen Seiten zu extrahieren.

Korrekturen
Sie können jetzt Daten mit neueren Versionen des Microsoft OpenAI GPT-4o-Modells extrahieren.

Bisher schlug die Datenextraktion fehl, wenn ältere Modelle in bestimmten Szenarien verwendet wurden.

Sie können jetzt MS OpenAI mit Ihrer eigenen Lizenz (BYOL) verwenden, um Daten zu extrahieren, ohne dass eine Fehlermeldung auftritt.

Bisher wurde in bestimmten Szenarien ein Fehler gemeldet.

Service Cloud-Fall-ID: 02177260

Die Datenextraktion funktioniert jetzt in Lerninstanzen, die einen generative KI-Anbieter verwenden und deren Felder mit der Modelloption Suchabfrage für generative KI konfiguriert sind, um die Antwort im JSON-Format zurückzugeben.

Zuvor konnte die Datenextraktion für solche Felder fehlschlagen oder leere Werte zurückgeben.

Sie können jetzt mithilfe von Tags Für Eingabeanforderungen Werte aus gestapelten Daten extrahieren. Einzelheiten finden Sie unter Verwenden von Eingabeaufforderungs-Tags in Eingabeaufforderungen für generative KI.

Bisher wurde in bestimmten Szenarien der korrekte Wert nicht extrahiert.

Daten, die aus Feldern extrahiert werden, enthalten kein Anführungszeichen-Präfix mehr.

Zuvor enthielten einige extrahierte Daten ein Anführungszeichen-Präfix.

Wenn Sie Dokumente mithilfe migrierter Lerninstanzen verarbeiten und die Dokumente zum Validator verschoben werden, kann das Validierungsfeedback nun die von der Standard-Engine extrahierten Feldwerte überschreiben.

Bisher konnte das Validierungsfeedback die Feldwerte in einem solchen Szenario nicht überschreiben.

3.35.7

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Änderungen
Verbessertes Tabellenextraktionsmodell (Service Cloud-Fall-ID: 02141734)

Das Tabellenextraktionsmodell wird aktualisiert, um Dokumente mit komplexen Kopfzeilen in Tabellen zu verarbeiten.

Korrekturen
Sie können nun Daten aus Tabellenheadern extrahieren, nachdem Sie ein Validierungsfeedback bereitgestellt haben.

Zuvor wurden in bestimmten Szenarien nur teilweise Daten extrahiert.

Service Cloud-Fall-ID: 02155613

Sie können jetzt Dokumente zur Extraktion von Daten verarbeiten, ohne dass speicherbezogene Fehler auftreten.

Zuvor wurde beim Verarbeiten bestimmter Dokumente ein speicherbezogener Fehler angezeigt.

Service Cloud-Fall-ID: 02141163, 02132605

Probleme mit Sicherheitslücken wurden behoben. Weitere Informationen erhalten Sie, wenn Sie auf den Download-Link der Version klicken und die Sicherheits- und Compliance-Berichte unter A-People Downloads page (Login required) einsehen.

3.34.7

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Änderungen
Verbessertes Tabellenextraktionsmodell

Das Tabellenextraktionsmodell wurde aktualisiert, um die Option des Tabellenende-Indikators zu verbessern.

Service Cloud-Fall-ID: 02145073, 02154694, 02160765

Korrekturen

Wenn Sie eine Lerninstanz erstellen und dabei den Dokumenttyp Unstrukturiert und die Sprache Schwedisch festlegen, extrahiert die Dokumentextraktion erfolgreich Daten aus dem Dokumenttyp „Unstrukturiert“ für die schwedische Sprache.

Sie können jetzt Abfragen in der Suchanfrage für Generative KI-Modell Option bereitstellen und erfolgreich Daten aus Packlisten-Dokumenten extrahieren, ohne einen Fehler zu sehen.

Bisher wurde in einem solchen Szenario ein Fehler gemeldet, wenn Sie bestimmte Abfragen bereitgestellt haben.

Service Cloud-Fall-ID: 02154341, 02154706, 02173044

Probleme mit Sicherheitslücken wurden behoben. Weitere Informationen erhalten Sie, wenn Sie auf den Download-Link der Version klicken und die Sicherheits- und Compliance-Berichte unter A-People Downloads page (Login required) einsehen.

3.33.18

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen

Sofort einsatzbereite Anthropic-Integration

Sie können Anthropic generative KI-Anbieter jetzt direkt ohne zusätzliche Konfiguration verwenden.

Erstellen einer Lerninstanz in Document Automation

Änderungen
Verbessertes Tabellenextraktionsmodell

Das Modell für die Tabellenextraktion wurde aktualisiert und bietet jetzt eine bessere Datenextraktion in unstrukturierten Dokumenttypen für Tabellen, die sich über mehrere Seiten erstrecken.

Fehlerbehebung

Beim Extrahieren von Daten mit einem generative KI-Anbieter geben Felder einen entsprechenden Wert zurück, wenn die Antwort in der Suchabfrage im JSON-Format angefordert wird.

Zuvor gaben bestimmte Felder in einem solchen Szenario leere Werte zurück.

3.33.13

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Änderungen
Verbessertes Tabellenextraktionsmodell (Service Cloud-Fall-ID: 02122434)

Das Tabellenextraktionsmodell wird aktualisiert, um die Extraktion der Tabellenstruktur und die Fehlerbehandlung zu verbessern.

Korrekturen
Sie können jetzt ein Validierungsfeedback in das Standardformularfeld Name des Lieferanten in einer Lerninstanz eingeben, um Lieferantennamen erfolgreich zu extrahieren.

Bisher trat in einem solchen Szenario ein Fehler auf.

Service Cloud-Fall-ID: 02124772, 02122434, 02126627, 02129868, 02132605

Bei Dokumenten, die mehrere Seiten und Tabellen enthalten, werden die Felder für die Primärspalte und den Tabellenende-Indikator für alle Tabellen in den erweiterten Trainingseinstellungen des Validators nach dem Validierungs-Feedback entsprechend aktualisiert.

Zuvor wurden die Felder für die Primärspalte und des Tabellenende-Indikators nicht für alle Tabellen aktualisiert.

Das Validierungs-Feedback funktioniert jetzt auch für Multi-Tabellen, wenn Sie Dokumente verarbeiten, die Multi-Tabellen mit Lerninstanzen enthalten.
Einschränkung
Die Datenextraktion schlägt in folgendem Szenario fehl:
  • Sie haben eine Lerninstanz erstellt, bei der der Dokumenttyp auf Unstrukturiertes Dokument und die Sprache auf Schwedisch gesetzt ist.
  • Der Extraktionsbot für die Lerninstanz verwendet die Dokumentenextraktion-Paketversion 3.33.13.

3.33.11

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Sie können jetzt Dokumente mit einer Lerninstanz bearbeiten, wenn:
  • die Lerninstanz mit Kontrollkästchenfeldern in IQ Bot erstellt wurde
  • die Lerninstanz mit Hilfe des Document Automation - IQ Bot-Bridge-Pakets zu Document Automation importiert wurde
  • die Option Genauigkeit durch Validierung verbessern für die Lerninstanz in Document Automation aktiviert ist

Bisher schlug die Datenextraktion in einem solchen Szenario fehl.

3.32.26

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Wenn Sie ein Dokument mit Google Document AI verarbeiten, wird der Extraktions-Bot jetzt erfolgreich für Portugiesisch ausgeführt, und das Dokument wird an den Validator gesendet.

Wenn Sie ein Dokument mit Handschrift- oder Signaturobjekten verarbeiten, werden diese Objekte jetzt in die endgültige JSON-Ausgabedatei aufgenommen.

Zuvor waren aufgrund des hohen Zuverlässigkeits-Grenzwerts für Signaturen Handschrift- oder Signaturobjekte nicht in der endgültigen JSON-Datei enthalten.

Wenn Sie ein Dokument mithilfe von Google Custom Document Extractor (CDE) mit BYOK-Einstellung (Bring Your Own Key) verarbeiten und der entsprechende Verarbeiter das Basismodell verwendet, schlägt die Dokumentverarbeitung nicht mehr aufgrund eines Transformationsfehlers fehl.
Mit dem verbesserten Tabellenstrukturmodell speziell für die Erkennung komplexer Tabellenspalten erhalten Sie nun noch genauere Extraktionsergebnisse.

Service Cloud-Fall-ID: 02110860

Für Lerninstanzen, die von IQ Bot zu Document Automation überbrückt werden, werden bei aktiviertem und angewendetem Validierungsfeedback und der Verarbeitung des nächsten Dokuments die Daten aus allen Seiten erfolgreich extrahiert, ohne dass Zeilen zusammengeführt werden.

3.32.23

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Bei der Sicherheitsüberprüfung festgestellte Schwachstellen wurden behoben.

3.32.22

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Mit dem verbesserten Modell zur Erkennung von Dokumenttabellen (das den Tabellenende-Indikator hinzufügt) können Sie jetzt Tabellendaten aus allen Seiten für die ausgewählte Sprache extrahieren. Auf diese Weise werden Probleme mit fehlenden Tabellen und der Extraktion der letzten Zeilen von Seiten reduziert.

Service Cloud-Fall-ID: 02065073

Mit der verbesserten Tabellenextraktion zeigen unstrukturierte Tabellen nicht mehr die Junk-Werte an, sondern extrahieren nun erfolgreich die Tabellendaten.
Nutzer können das Validierungsfeedback jetzt in ihrer Document Automation-Umgebung speichern, wenn der Proxy auf dem Bot-Agenten-Rechner aktiviert ist.

Service Cloud-Fall-ID: 02092484

Mit Google Vision OCR und aktiviertem Proxy schlägt die Dokumentenextraktion bei unstrukturierten Dokumenten nicht mehr fehl und es wird keine Fehlermeldung angezeigt.

Service Cloud-Fall-ID: 02104409

3.31.22

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Nachdem der Lerninstanz ein Validierungsfeedback hinzugefügt wurde, schlägt die Dokumentextraktion nicht mehr mit einer Fehlermeldung fehl.

Zuvor schlug die Dokumentextraktion fehl, wenn das Kontrollkästchen für die Validierung aktiviert war.

Nach dem Hinzufügen von Validierungsfeedback zur Lerninstanz wird das Feedback für alle Tabellen auf allen Seiten des Dokuments gespeichert, und die Daten werden korrekt aus allen Seiten extrahiert.

Zuvor wurde das Feedback nicht für alle Seiten gespeichert.

Service Cloud-Fall-ID: 01995135, 02093575, 02093389

Nach dem Hinzufügen des Validierungs-Feedbacks werden jetzt, wenn die Tabellen-IDs übereinstimmen, Daten aus allen Tabellen jeder Seite extrahiert und im Validator angezeigt.

Zuvor wurden in solchen Fällen einige Seiten übersprungen, und im Validator wurden nicht die Daten von allen Seiten angezeigt.

Wenn Sie die erweiterten Trainingseinstellungen anwenden, müssen Sie die Spalten vertauschen, und alle Spaltenwerte müssen korrekt zugeordnet werden. Daraufhin werden die Daten korrekt in getrennte Spalten extrahiert. Sie können entweder alle Spaltenzellen erneut zuordnen oder alle anderen fehlerhaften Zellzeilen entfernen, während die ersten beiden Zeilen intakt bleiben. Es dürfen keine falschen Zellen in der Spalte vorhanden sein, und alle Zellen der Spalte müssen die richtigen Werte haben.

Bisher wurden in solchen Fällen die Daten aus zwei Spalten in eine einzige Spalte extrahiert.

Sie können jetzt die Werte der Tabellenfelder in der richtigen Reihenfolge extrahieren, und das Problem der Extraktion aus mehreren Zeilen tritt nicht mehr auf. Sie können auch die Funktion Tabellenende-Indikator dazu verwenden, Daten aus mehreren Zeilen zu extrahieren, nachdem Sie die Feedbackdaten angewendet haben, wenn nur eine einzige Zeile in der Tabelle vorhanden ist.
Anmerkung: Bei einzeiligen Tabellen ist es am besten, die Funktion Tabellenende-Indikator zu verwenden. Andernfalls kann die Extraktion in bestimmten Szenarien auch teilweise erfolgen.

Service Cloud-Fall-ID: 02091013

Wenn ein Dokument trainiert wurde und ein Nutzer dasselbe Dokument mit Google Vision OCR bearbeitet, wird das Feedback gespeichert, und die erforderlichen Daten werden extrahiert.

Bisher war es in solchen Fällen nicht möglich, einen bestimmten Dokumenttyp zu verarbeiten, und das Dokument musste jedes Mal manuell validiert werden.

Service Cloud-Fall-ID: 02098682

3.31.17

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Mit Google Vision OCR können Sie die Dokumente jetzt auch ohne Google Document AI-Lizenz erfolgreich bearbeiten. Es wird auch keine Fehlermeldung erzeugt.

Zuvor wurde für die Verarbeitung der Dokumente eine Google Document AI-Lizenz angefordert und beim Extrahieren der Dokumente ein Fehler erzeugt. Infolgedessen konnten Sie keine Dokumente mit Google Vision OCR extrahieren.

Service Cloud-Fall-ID: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Wenn Nutzer eine Lerninstanz mit Google Document AI (BYOK) und authentifiziertem Proxy erstellen, schlägt die Dokumentenextraktion bei Dokumenten mit mehr als 10 Seiten nicht mehr fehl.

Bisher schlug die Extraktion in solchen Fällen mit einer Fehlermeldung fehl und die Nutzer konnten die Dokumente nicht bearbeiten.

3.31.15

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Wenn Dokumentenregeln mehrere Bedingungen mit dem Operator UND mit (oder ohne) Gruppe enthalten, wird jetzt eine entsprechende Fehlermeldung angezeigt. Außerdem wird die entsprechende Aktion jetzt auf die Felder angewendet.

3.31.13

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Änderungen
Mit der verbesserten Extraktion von unstrukturierten Dokumenten in Document Automation können Sie:
  • Komplexe Abfragen effektiv verarbeiten
  • Dokumente mit verbesserter Navigation zur entsprechenden Seite validieren
Korrekturen
Mit der verbesserten Tabellenextraktion unter Verwendung der ABBYY OCR-Engine funktioniert das heuristische Feedback jetzt ordnungsgemäß.
  • Deutsche Version: Die Rechnungsextraktion funktioniert nach der Anwendung von Feedback korrekt und alle Tabellendaten werden extrahiert.
  • Spanische Version: Die Tabellendaten werden korrekt aus dem Rechnungsdokument extrahiert.
  • Englische Version: Die Rechnungsdaten werden aus allen Seiten mit ABBYY OCR extrahiert.

Service Cloud-Fall-ID: 01995901

Wenn ein Nutzer die Tabellendaten aus einer PDF-Datei extrahiert, in der die Tabelle auf mehrere Seiten erweitert ist, werden die Daten nach Anwendung des heuristischen Feedbacks aus allen Seiten erfolgreich extrahiert.

Bisher war es nicht möglich, Daten von der zweiten Seite der PDF-Datei zu extrahieren, wenn die Tabelle auf mehrere Seiten erweitert wurde.

Service Cloud-Fall-ID: 01996536

Beginnend mit der Extrahierung von der ersten Seite für alle Felder funktioniert das heuristische Feedback nun bei der Erfassung von mehrzeiligen Tabellendaten korrekt und erzeugt die richtige Ausgabe.

Zuvor wurden Daten aus mehrzeiligen Tabellen auch dann nicht extrahiert, wenn das heuristische Feedback bereitgestellt wurde. Infolgedessen wurde die Ausgabe nicht korrekt erzeugt.

Service Cloud-Fall-ID: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Bei Microsoft Standardformulare schlägt die Tabellenextraktion nicht mehr fehl, wenn die Zellen leer sind, und Nutzer können das Dokument erfolgreich extrahieren.
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, zeigt das extrahierte Dokument die korrekte Reihenfolge der Wörter für die Daten auf allen Seiten an.
Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, werden alle Werte nach der Extraktion in der Tabelle angezeigt.

Bisher wurde in solchen Fällen die systemidentifizierte Region (SIR) hervorgehoben, aber in der Tabelle wurde ein leerer Wert angezeigt.

Wenn ein Nutzer eine .dw-Datei mit heuristischem Feedback importiert und ein Dokument verarbeitet, das in der letzten Zeile einen Negativwert enthält, werden die Dokumente korrekt extrahiert, ohne dass der Negativwert in der letzten Zeile übersprungen wird.

Bisher wurde in solchen Fällen die letzte Zeile übersprungen, was entweder zu Datenverlusten oder zu fehlerhafter Verarbeitung führte.

Wenn ein Nutzer ein Dokument verarbeitet, das eine Tabelle enthält, wird die Extraktion ohne die Fehlermeldung DOCUMENT_PARTIALLY_FAILED oder Extraction Timeout erfolgreich abgeschlossen.

Zuvor wurden in solchen Fällen einige Dokumente nicht extrahiert, weil mehrere Erkennungen aus derselben Tabelle vorlagen und ein Problem mit der Tabellengröße (max () arg) auftrat.

Wenn ein Nutzer eine Lerninstanz importiert und die Dokumente verarbeitet, werden alle Zeilen separat aus allen Seiten extrahiert.

Zuvor wurden die Zeilen der zweiten Seite in einer Zeile zusammengeführt.

Einschränkungen
Wenn ein Nutzer Google Vision OCR verwendet, funktioniert die Tabellenerkennung oder Extraktion nicht.

Problemumgehung: Es wird empfohlen, die ABBYY OCR-Engine zu verwenden.

Service Cloud-Fall-ID: 01995901

In bestimmten Fällen, in denen sich die Tabellen über mehrere Seiten erstrecken, ohne dass auf allen Seiten Header vorhanden sind (headerlose Seiten), stellen Nutzer möglicherweise fest, dass die Daten nach Anwendung des Feedbacks nicht aus allen Seiten extrahiert werden.

3.30.24

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Korrekturen
Die Nutzer können nun die extrahierten Daten aus der zweiten Zeile korrekt anzeigen, indem sie das heuristische Feedback verwenden.
Für den Dokumenttyp Bestellung können Sie jetzt die Werte der Tabellenfelder korrekt aus allen Seiten extrahieren.
Die erstellte Feedbackdatei zeigt keine Fehlermeldung mehr an und die Nutzer können Dokumente erfolgreich verarbeiten.

3.30.22

  • Kompatible Bot-Agent-Version: 21.252 oder höher
  • Kompatible Control Room-Version: 19223 oder höher
Neue Funktionen
Document Automation bietet eine verbesserte Extraktion durch neue Dokumentendaten abrufen- und Dokumentendaten aktualisieren-Aktionen. Sie können diese Aktionen verwenden, um benutzerdefinierte Logik für die Datenmanipulation und -validierung anzuwenden und den manuellen Überprüfungsaufwand zu reduzieren.

3.30.21

  • Kompatible Bot-Agent-Version: 21.98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Korrekturen
Diese Dokumentenextraktion-Paketveröffentlichung ist ein Patch, um den Fehler „501: DOCUMENT_PARTIALLY_FAILED\' Fehler, der bei der Verarbeitung einiger Dokumente aufgetreten ist.

3.30.19

  • Kompatible Bot-Agent-Version: 21.98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Korrekturen
Das Dokumentenextraktion-Paket bietet verbesserte Extraktionsmöglichkeiten für komplexe Tabellenkopfspalten.
  • Szenario 1: Extrahieren von Daten aus Tabellenkopfspalten mit mehreren Überschriften, die in einer einzigen Spalte zusammengefasst sind.
  • Szenario 2: Extrahieren von Daten aus Tabellenkopfspalten mit mehrfach geteilten Unterüberschriften.
Befolgen Sie diese Schritte, um die verbesserte Extraktion von Tabellenkopfdaten zu aktivieren:
  1. Erstellen oder bearbeiten Sie eine Lerninstanz.
  2. Um die Tabellenfelder hinzuzufügen oder zu bearbeiten, navigieren Sie zur Registerkarte Tabellenfelder und klicken Sie auf Feld hinzufügen > Feldeigenschaften.
  3. Fügen Sie jeden Tabellenkopf (Überschriften) als separates Tabellenfeld hinzu. Beispiel:

    Szenario 1: Fügen Sie den Spaltenkopf (Überschrift) und jede zusammengeführte Unterüberschrift als separates Tabellenfeld hinzu. Anhand der Bildschirmabbildung würden Sie Daten aus den drei zusammengeführten Spaltenkopffeldern extrahieren, für die Sie drei separate Tabellenfelder erstellen würden, wie CGST mit dem Alias CGST, SGST mit dem Alias SGST und CESS mit dem Alias CESS.

    Beispiel eines Spaltenkopfs mit mehreren Unterüberschriften.

    Szenario 2: Fügen Sie den Spaltenkopf und jede geteilte Unterüberschrift als separates Tabellenfeld hinzu. Ähnlich wie im obigen Beispiel müssten Sie für einen Spaltenkopf CGST mit aufgeteilten Unterüberschriften Rate und AMT zwei separate Tabellenfelder CGST Rate mit dem Alias CGST Rate und CGST AMT mit dem Alias CGST AMT erstellen.

    Beispiel eines Spaltenkopfs mit mehreren geteilten Unterüberschriften.

  4. Klicken Sie auf Absenden, um Ihre Änderungen zu speichern.

3.29.17

  • Kompatible Bot-Agent-Version: 21.98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Korrekturen
Das Dokumentenextraktionspaket enthält Korrekturen zur Verbesserung der Extraktion von Formular- und Tabellenfeldern.

3.29.14

  • Kompatible Bot-Agent-Version: 21.98 oder höher
  • Kompatible Control Room-Version: 15345 oder höher
Neue Funktionen
Document Automation bietet eine verbesserte Extraktion durch heuristisches Feedback mit Schwerpunkt auf komplexen Szenarien, wie z. B. mehrzeilige oder mehrseitige Tabellen. Darüber hinaus gibt es Verbesserungen beim Extrahieren sowohl für Formularfelder als auch sofort einsetzbare Leistungsfunktionen (insbesondere für Tabellenfelder).