Verbesserung der Extraktion von Tabellendaten
- Zuletzt aktualisiert2024/11/28
Verbesserung der Extraktion von Tabellendaten
Verwenden Sie die erweiterten Trainingseinstellungen, um Ihre Dokumente zu trainieren und zusätzliche Eingaben für die Document Automation-Extraktionsmaschine bereitzustellen und damit die Extraktion von Tabellendaten zu verbessern.
- Primärspalte: Legen Sie die Primärspalte für die Zeilenidentifikation entsprechend Ihren Anforderungen fest.
- Indikator für Ende der Tabelle: Fügen Sie einen Tabellenende-Indikatorwert hinzu, damit das System Daten extrahiert, bis der Wert den angegebenen Wert erreicht hat, ausschließlich des Tabellenende-Indikatorwerts.
- Headerbezeichnungen: die Tabellenfelder nach Bedarf anpassen oder neu zuordnen.
Vorbereitungen
- Die Option Erweiterte Trainingseinstellungen ist nur verfügbar, wenn die Option Genauigkeit durch Validierung verbessern aktiviert ist.
- Vergewissern Sie sich, dass Sie über die Berechtigung Gruppen trainieren verfügen, um Informationen über Headerbezeichnungen, den Tabellenende-Indikator und eine Primärspalte für die Zeilenerkennung bereitzustellen.
- Es kann nur eine einzige Primärspalte geben.
- Der Tabellenende-Indikator ist ein Text für eine vom System identifizierte Region (SIR).
Prozedur
Primärspalte
Zum Beispiel werden nach dem Extrahieren des Dokuments die Daten aus mehrzeiligen Tabellen aus der Spalte Elementnummer in eine einzige Zeile extrahiert, aber Sie möchten sie in separate Zeilen extrahieren. In solchen Fällen können Sie die Elementnummer als Primärspalte festlegen, um die Tabellenextraktion zu verbessern. Weitere Einzelheiten finden Sie im Beispiel für das Einstellen der Primärspalte mit erweiterten Trainingseinstellungen.
Tabellenende-Indikator
Wenn Sie beispielsweise ein Dokument verarbeiten, werden seine gesamten Tabellendaten extrahiert, obwohl Sie nur die Zeilendaten bis Gesamtbetrag extrahieren möchten. In solchen Fällen können Sie den Wert für den Tabellenende-Indikator angeben, sodass die Tabellendaten bis zu diesem Wert (ohne den Tabellenende-Indikator) und keine weiteren Zeilendaten extrahiert werden.
Headerbezeichnung
Wenn in den Tabellendaten Bezeichnungen nicht übereinstimmen, z. B. die extrahierte Headerbezeichnung Stückpreis lautet, Sie aber die Headerbezeichnung Preis wünschen. In solchen Fällen können Sie die Headerbezeichnung ändern.
Ein weiterer Anwendungsfall ist, dass Sie alle Werte von Unit Price neu zuordnen oder die Headerbezeichnung zusammen mit den Spaltendaten ändern können. Sie können die automatische Ausfüllfunktion verwenden, um diese Neuzuordnung zu beschleunigen. Zum Beispiel wird nach der Extraktion die Spalte Preis aus der Lerninstanz als Erweiterter Preis extrahiert, aber Sie wünschen die Headerbezeichnung als Stückpreis mit den entsprechenden Spaltendaten. In solchen Fällen können Sie die Headerbezeichnung Erweiterter Preis zu Stückpreis ändern, und Sie müssen alle Zellwerte der Spalte Stückpreis auswählen und neu zuordnen.