Verbessern der Ausgabequalität mithilfe von OCR-Konfidenz

Verbessern Sie die Ausgabequalität der IQ Bot-Plattform mithilfe von System Identified Region (SIR) und OCR-Konfidenz, indem Sie sie mit einem vordefinierten Grenzwert vergleichen.

Die konfidenzbasierte Validierung ist für ein Textfeld und für Datums- oder Zahlenfelder nützlich, da sie hilft, dass ein Dokument mit strittigen Werten zur menschlichen Ansicht anzuzeigen, auch wenn die Felder die festgelegten Validierungskriterien erfüllen.

Aktivieren der Validierung auf Basis der OCR-Konfidenz

Anmerkung: Diese Option ist nur verfügbar, wenn Sie beim Erstellen der Lerninstanz Tesseract OCR ausgewählt haben.

Diese Funktion ist standardmäßig deaktiviert. Um diese Funktion zu aktivieren, öffnen Sie die Konfigurationsdatei Settings.txt unter <IQ Bot Installation Folder>\Configurations\ und legen Sie den gewünschten Schwellenwert in der Eigenschaft ConfemiceThreshold fest. Setzen Sie für dieses Beispiel den Konfidenzgrenzwert auf Zeichenebene auf 99, d. h. ConfidenceThreshold=99. Wenn diese Funktion deaktiviert ist, wird der Standardwert auf 0 festgelegt, um anzuzeigen, dass die Funktion deaktiviert ist.

Anmerkung: Der Konfidenzgrenzwert gilt einheitlich für alle Lerninstanzen.

So funktioniert die Validierung auf Basis der OCR-Konfidenz

Falls in einem Dokument der Konfidenzgrad der SIR-Zeichenebene eines Felds niedriger ist als der festgelegte Konfidenzgrenzwert, schlägt die Validierung für dieses Feld fehl, was zum Versagen dieses Dokuments führt.

Anmerkung: Wenn kein OCR-Konfidenz-Validierungsfehler vorliegt, sondern der Wert eines Felds gegen eine andere Validierungsregel (z. B. ungültiges Zahlenformat) verstößt, wird diese QuickInfo anstelle der QuickInfo Konfidenz gering angezeigt.

Während Sie ein Dokument trainieren, wird ein Fehler bei der konfidenzbasierten Validierung für ein Feld in der Vorschau in einem orangefarbenen Feld angezeigt, wenn für dieses Feld keine anderen Validierungsfehler vorhanden sind. Andere Validierungsfehler haben Vorrang vor der Validierung der OCR-Konfidenz auf Zeichenebene.

Troubleshoot: Wenn die OCR-Engine keine SIRs für PDF-Dokumente in chinesischer Sprache identifizieren kann, beheben Sie das Problem: