Erstellen Sie ein Standardformulare-Extraktionsmodell im Control Room.
Vorbereitungen
- Stellen Sie sicher, dass Ihr Control Room die Document Automation-Produktlizenz (Anzahl der Seiten) hat. Weitere Details zu Lizenzen finden Sie unter Verstehen von Lizenzen in Document Automation.
- Sie müssen die Rolle AAE_IQ Bot Admin oder AAE_IQ Bot Services haben, um diese Aufgabe zu erledigen.
- Identifizieren Sie fünf bis fünfzehn Trainingsdokumente
- Die Obergrenze für den Standardformulare-Dokumententyp beträgt 157.286.400 Bytes.
- Informationen zu den Einschränkungen bei der Verwendung benutzerdefinierter neuronaler Modelle finden Sie unter Document Intelligence custom neural model.
Prozedur
-
Im Control Room navigieren Sie zu
und klicken Sie auf Modell erstellen.
Anmerkung: Sie werden die Option
Modell erstellen auf der Seite der Lerninstanzen nicht sehen können, um Modelle zu erstellen, wenn Sie Ihre eigene Lizenz verwenden (BYOL). Einzelheiten finden Sie unter
Build and train a custom extraction model.
Das Fenster Projekte wird in einer neuen Registerkarte geöffnet.
-
Klicken Sie auf Projekt erstellen.
-
Geben Sie einen Namen für das Projekt ein, klicken Sie auf Durchsuchen, um Dokumente zum Trainieren des Extraktionsmodells hochzuladen, und klicken Sie auf Erstellen.
-
Definieren der Feld-Tags:
-
Klicken Sie auf das Pluszeichen (+) in der oberen rechten Ecke des Bildschirms und wählen Sie Feld.
-
Geben Sie einen Namen für das Tag ein und drücken Sie die Eingabetaste. Zum Beispiel
Invoice Number
oder Invoice Date
.
Anmerkung: Jedem Feld-Tag und dem zugehörigen Positions-Tag wird eine eindeutige Farbe zugewiesen, sodass sie bei der visuellen Unterscheidung oder Validierung von Daten leicht zugeordnet werden können. Wenn Sie auf ein Feld-Tag klicken, wird das entsprechende Positions-Tag im Dokument hervorgehoben.
-
Definieren der Tabellen-Tags:
-
Klicken Sie auf das Pluszeichen (+) in der oberen rechten Ecke des Bildschirms und wählen Sie Tabelle.
-
Geben Sie einen Namen für die Tabelle ein und klicken Sie auf Erstellen.
-
Wählen Sie für jede Spalte in der Tabelle den Spaltennamen aus und führen Sie eine der folgenden Aktionen aus:
-
Spalte umbenennen: Wählen Sie diese Option, um die Spalte umzubenennen, und drücken Sie zum Umbenennen die Eingabetaste.
-
Spalte einfügen: Wählen Sie diese Option, um eine Spalte nach der ausgewählten Spalte einzufügen.
-
Spalte löschen: Wählen Sie diese Option, um die ausgewählte Spalte zu löschen.
-
Aktualisieren Sie die Spaltendetails.
- Optional:
Klicken Sie auf das Plussymbol (+), um weitere Zeilen hinzuzufügen.
-
Klicken Sie auf die Schaltfläche „Schließen“ (x) in der oberen rechten Ecke des Bildschirms, um die Tabellenansicht zu verlassen.
-
Klicken Sie in der oberen linken Ecke des Bildschirms auf die Option Bereich und definieren Sie die Position der Daten für jedes Feld:
-
Markieren Sie für die Formularfelder den Speicherort der zu extrahierenden Daten und wählen Sie den entsprechende Feldnamen aus der Liste aus.
-
Markieren Sie für jede Zeile in der Tabelle den Ort, an dem die Daten extrahiert werden sollen, und wählen Sie dann die entsprechende Zelle aus. Klicken Sie auf die Schaltfläche „Schließen“ (x) in der oberen rechten Ecke des Bildschirms, um die Tabellenansicht zu verlassen.
-
Wählen Sie das nächste Dokument aus und wiederholen Sie die Schritte, um die Speicherorte der Formular- und Tabellenfelder festzulegen.
-
Klicken Sie auf das Symbol Trainieren und geben Sie einen Namen für das Modell ein.
-
Wählen Sie eines der folgenden Modelle aus:
-
Vorlage: Die benutzerdefinierte Vorlage ist ein einfach zu trainierendes Dokumentmodell, das beschriftete Schlüssel-Wert-Paare, Auswahlmarken, Tabellen, Bereiche und Signaturen aus Dokumenten präzise extrahiert. Dieses Modell wird in der Regel verwendet, um Daten aus strukturierten Dokumenten zu extrahieren, die über ein konsistentes Layout und definierte visuelle Vorlagen verfügen. Einzelheiten finden Sie unter Document Intelligence custom template model.
-
Neuronal: Das benutzerdefinierte neuronale Modell ist ein Deep Learning-Modelltyp, der Layout- und Sprachfunktionen kombiniert, um beschriftete Felder aus Dokumenten präzise zu extrahieren. Dieses Modell eignet sich besser zum Extrahieren von Daten aus verschiedenen Dokumenttypen wie halbstrukturierten und unstrukturierten Dokumenten. Einzelheiten finden Sie unter Document Intelligence custom neural model.
Wichtig: Da das benutzerdefinierte neuronale Modell Deep Learning-Technologie verwendet, kann es einige Zeit dauern, bis das Training für das Modell abgeschlossen ist. Daher wird das Modell möglicherweise nicht sofort auf der Seite „Benutzerdefinierte Modelle“ angezeigt. Wir empfehlen Ihnen, den Abschluss des Trainings abzuwarten und dann dieses Modell für die Verwendung auszuwählen.
-
Klicken Sie auf Trainieren.
-
Klicken Sie auf das Symbol Analysieren, klicken Sie auf Datei suchen, wählen Sie ein Dokument aus und klicken Sie auf Analyse ausführen, um das Extraktionsmodell zu testen.
Anmerkung: Ab
Automation 360 v.29 können Sie neue Modelle nur in
Azure AI Document Intelligence v.3.0 erstellen und trainieren. Wenn Sie mit
Azure AI Document Intelligence v.2.1 arbeiten, müssen Sie eine Aktualisierung auf
Azure AI Document Intelligence v.3.0 durchführen, indem Sie die folgenden Schritte ausführen:
- Öffnen Sie Projekt.
- Klicken Sie auf das Symbol Trainieren.
- Klicken Sie auf Trainieren. Das Modell wird in Azure AI Document Intelligence v.3.0 erstellt.