Erstellen einer Lerninstanz in Community Edition

Erstellen Sie eine Lerninstanz, um mit der Verarbeitung von Dokumenten zu beginnen. In der Community Edition können Sie mit dem OCR-Anbieter ABBYY Daten aus unterstützten Dokumenttypen und Sprachen extrahieren.

Prozedur

  1. From the Control Room home page, navigate to KI > Document Automation , and click Create Learning Instance.
  2. Enter a name and description for the learning instance.
    Document Automation does not allow duplicate learning instance names, so the name you provide must be unique.
  3. Wählen Sie einen geeigneten Dokumenttyp aus.
    Anmerkung: Verwenden Sie den Dokumenttyp Nutzerdefiniert, um Dokumente zu verarbeiten, die visuell Rechnungen ähneln, wie z. B. Bestellungen und Kundenaufträge, die Schlüssel-Wert-Paare und eine Tabellenstruktur enthalten. In diesem Dokumenttyp erstellen und konfigurieren Sie alle Formular- und Tabellenfelder.
  4. Wählen Sie die Sprache.
  5. Optional: Mit der Option Genauigkeit durch Validierung verbessern können Sie Feedback zur Verbesserung der Extraktionsergebnisse an das System senden. Weitere Informationen finden Sie unter Verbessern der Extraktionsgenauigkeit durch Validierung.
  6. Optional: Wählen Sie die Option Generative KI-gesteuerte Datenextraktion, um die generative KI-Funktionen für die Extraktion zu nutzen. Weitere Informationen finden Sie unter Document Automation – Datenextraktion mit generative KI.

    Generative KI-Anbieter bieten die folgenden Vorteile:

    • Effiziente Verarbeitung großer, unstrukturierter Dokumente
    • Kann Dokumente in englischer und anderen Sprachen bearbeiten
    Wählen Sie einen der folgenden generative KI-Anbieter aus:
    Anmerkung:
    • Wenn Sie von einer früheren Version auf v.38 oder höher aktualisieren, wird Open AI als Standard-Extraktionsanbieter festgelegt.
    • Wenn Sie Dokumente mit OpenAI verarbeitet haben und dann zu Anthropic für die Datenextraktion gewechselt haben, verwenden nur die Dokumente, die nach dem Wechsel zu Anthropic verarbeitet werden, Anthropic für die Datenextraktion. Für die bereits verarbeiteten Dokumente werden die Daten mit Azure OpenAI extrahiert.
    • Open AI: Azure OpenAI-Modell wird für die Datenextraktion verwendet. Dieser Anbieter ist über eine eingebettete Lizenz (erfordert keine zusätzlichen Lizenzen) oder Bring Your Own License (BYOL) verfügbar.

      Wenn Sie BYOL verwenden, stellen Sie sicher, dass Sie die zusätzlichen Einstellungen für OpenAI in dem Extraktions-Bot konfigurieren, um diesen Anbieter zu verwenden. Einzelheiten finden Sie unter Aktion „Daten extrahieren“.

    • Anthropic: Sie können jetzt die Anthropic generative KI-Modelle über AWS und GCP für die Datenextraktion in Document Automation verwenden. Dieses Angebot bietet Ihnen die Flexibilität, das generative KI-Modell je nach Cloud-Anbieter auszuwählen, den Ihr Unternehmen zertifiziert hat.

      Wenn Sie BYOL nutzen, müssen Sie das Anthropic Claude-Modell auf dem Google Vertex AI- oder Amazon Bedrock-Dienst konfigurieren und dann die zusätzlichen Einstellungen im Extraktions-Bot konfigurieren, um diesen Anbieter zu verwenden. Einzelheiten finden Sie unter Aktion „Daten extrahieren“.

  7. Click Next.

We recommend that you open a sample document side by side with the Control Room window as you configure the form and table fields.

Anmerkung:
  • A form field is a type of field that occurs only one time in a document.
  • A table field is a type of field that reoccurs throughout a document, typically in the form of a table.

  1. Configure the form and table fields for extraction. For more details, see Ansicht und Suchfelder.
    1. Click a field to open the fields editor. For more details, see .Leitlinien zur Bearbeitung der Felder und Erstellung von benutzerdefinierten Aliasen
    2. Hover over the menu icon to the right of a field to access the up/down arrows.
    3. Use the arrows to rearrange the order of the fields for a more efficient manual validation.
      The order of the fields does not impact extraction.
    To learn more about the other field attributes, see Überlegungen zu Formular- und Tabellenfeldern.
  2. Click Add a field and specify the fields details such as field name, fields label, confidence, data type, format date/number, and so on. For more details, see Überlegungen zu Formular- und Tabellenfeldern.
    Anmerkung: If you have selected the Generative AI-driven data extraction option, we recommend that you add good prompts for fields to get the expected results when you create the learning instances. See Document Automation – Datenextraktion mit generative KI.
    The following image shows form and table fields configured in a learning instance:
    Form fields of a learning instance

    Table fields of a learning instance and adding custom table at learning instance level
    Anmerkung: The Add a field option is not available for Receipts document type.
  3. Click Create.

Nächste Maßnahme

Laden Sie Dokumente in die Lerninstanz hoch, beheben Sie Validierungsfehler und überprüfen Sie die extrahierten Daten: Dokumente bearbeiten in Community Edition