Sie befinden sich hier:
Definieren der aus Ihren Dokumenten zu extrahierenden Daten
Dokumentverarbeitungskonfigurationen definieren die Struktur und Regeln für das Extrahieren von Daten aus Ihren Dokumenten. Durch das Erstellen dieser Konfigurationen definieren Sie, nach welchen Informationen gesucht werden soll und wie die extrahierten Daten organisiert werden sollen. Dieser Schritt ist wichtig, bevor Sie Dokumente in Ihren Flows verarbeiten oder Überprüfungs-Workflows einrichten können.
Erforderliche Editionen
| Verfügbarkeit: Lightning Experience |
| Unterstützte Editionen anzeigen. |
| Für diese Funktion ist MuleSoft für Flow erforderlich: IDP-Add-On. Für die Professional Edition ist das API-Zugriffs-Add-On erforderlich. Wenden Sie sich zum Kauf an Ihren Salesforce-Kundenbeauftragten. |
| Für die Dokumentverarbeitungsfunktionen muss die generative AI von Einstein unter "Setup" aktiviert und Data 360 für Ihre Organisation bereitgestellt und aktiviert sein. |
| MuleSoft für Flow: Für die mit Agentforce verwendeten IDP-Funktionen ist die Foundations oder Agentforce 1 Edition erforderlich. Wenden Sie sich zum Erwerb dieser Editionen an Ihren Salesforce-Kundenbeauftragten. |
| Erforderliche Benutzerberechtigungen | |
|---|---|
| Erstellen, Lesen, Bearbeiten und Löschen von Dokumentverarbeitungskonfigurationen: | Verwalten von Dokumentverarbeitungskonfigurationen |
Bevor Sie definieren, welche Daten aus Ihren Dokumenten extrahiert werden sollen, stellen Sie sicher, dass Sie über Folgendes verfügen:
- Beispieldokumente des Typs, den Sie verarbeiten möchten (PDFs, Bilder oder gescannte Dokumente)
- Eine Liste der spezifischen Datenfelder, die Sie aus Ihren Dokumenten extrahieren möchten
- Knowledge der Datentypen für jedes Feld (Text, Zahl, Währung oder Datum)
- Grundlegendes zur Dokumentstruktur und zum Layout, das verarbeitet werden soll
- Grundlegende Kenntnisse von Flow Builder (für die nächsten Schritte im Workflow)
Erstellen Sie Dokumentverarbeitungskonfigurationen in der Automatisierungsanwendung, um die Anweisungen und die Ausgabestruktur für jeden zu verarbeitenden Dokumenttyp zu definieren. Sie können Dokumente hochladen und den Extraktionsprozess testen, während Sie die Dokumentverarbeitungskonfiguration erstellen.
- Wählen Sie in der Automatisierungsanwendung die Registerkarte "Dokumentverarbeitung" aus.
- Klicken Sie auf Neue Dokumentverarbeitungskonfiguration.
-
Klicken Sie auf Dateien hochladen und wählen Sie ein Beispieldokument aus, das als Grundlage für die Erstellung einer Dokumentverarbeitungskonfiguration verwendet werden soll.
Klicken Sie nach Abschluss des Uploads auf Fertig.
-
Klicken Sie auf Verwenden der automatischen Extraktion, um automatisch Felder und Tabellen basierend auf dem hochgeladenen Dokument hinzuzufügen.
Dies ist der empfohlene Ansatz, da das Beispieldokument gescannt und alle gefundenen Felder automatisch identifiziert und extrahiert werden.
- Optional:
Fügen Sie der Konfiguration bei Bedarf manuell zusätzliche Felder und Tabellen hinzu.
- Klicken Sie im Bereich "Ausgaben" auf Felder und dann auf Feld hinzufügen.
- Geben Sie "Name", "Feldtyp" (Zeichenfolge, Zahl, boolescher Wert) und optional "Aufforderungsanweisungen" mit zusätzlichen Details an, die Einstein beim Extrahieren berücksichtigen kann.
- Klicken Sie auf Hinzufügen.
- Fügen Sie nach Bedarf weiterhin Felder hinzu.
- Wählen Sie zum Hinzufügen von Tabellen im Bereich "Ausgaben" die Registerkarte "Tabellen" aus.
- Klicken Sie auf Tabelle hinzufügen.
- Geben Sie den Namen ein, optional Aufforderungsanweisungen und klicken Sie auf Hinzufügen.
- Klicken Sie auf den Tabellennamen und wählen Sie die Registerkarte Spalten aus.
- Klicken Sie auf Spalte hinzufügen.
- Geben Sie Name, Feldtyp und optional Aufforderungsanweisungen an und klicken Sie auf Hinzufügen.
Sie können Felder und Tabellen nach der automatischen Extraktion manuell hinzufügen oder die Konfiguration komplett manuell erstellen, indem Sie auf Manuell erstellen statt auf Automatische Extraktion verwenden klicken. -
Klicken Sie auf Testen, um Ihr hochgeladenes Dokument zu analysieren und die extrahierten Tabellendaten anzuzeigen.
In den Testergebnissen werden extrahierte Werte für jedes Feld und jede Tabelle sowie Konfidenzbewertungen angezeigt, die die Genauigkeit der Extraktion angeben.
- Geben Sie nach Abschluss der Konfiguration einen Namen für Ihre Dokumentverarbeitungskonfiguration an und klicken Sie auf Speichern.
Ihre Dokumentverarbeitungskonfiguration ist nun gespeichert und einsatzbereit. Die Konfiguration definiert alle Felder und Datentypen, die aus Ihren Dokumenten extrahiert werden sollen. Sie können überprüfen, ob die Konfiguration abgeschlossen ist, indem Sie Folgendes überprüfen:
- Alle Pflichtfelder sind mit den entsprechenden Datentypen definiert
- Die Testanalyse zeigt genaue Extraktionsergebnisse an
- Konfidenzbewertungen sind für Ihren Anwendungsfall akzeptabel
Diese Konfiguration kann nun in Ihren Flows mit der Aktion "Daten aus Dokument extrahieren" verwendet werden und Sie können Überprüfungs-Frameworks erstellen, um die extrahierten Daten zu validieren.
Im Folgenden finden Sie ein Beispiel für Feldkonfigurationen zum Verarbeiten von Rechnungen:
| Feldname | API-Name | Feldtyp | Aufforderungsanweisung |
|---|---|---|---|
| Firmenname | Firmenname | Text | Extrahieren des Anbieter- oder Unternehmensnamens aus der Rechnungskopfzeile |
| Auftragsnummer | OrderNumber | Text | Finden der Rechnungs- oder Auftragsnummer, in der Regel oben im Dokument |
| Käufername | PurchaserName | Text | Extrahieren des Kunden- oder Käufernamens aus dem Abrechnungsabschnitt |
| Summe | TotalAmount | Währung | Ermitteln des fälligen Gesamtbetrags, in der Regel unten auf der Rechnung |
| Steuer | TaxAmount | Währung | Extrahieren des Steuerbetrags, sofern separat aufgeführt |
In diesem Beispiel wird gezeigt, wie Felddefinitionen für allgemeine Rechnungsdaten strukturiert werden. Mithilfe der Anweisungen zur Eingabeaufforderung kann Einstein nachvollziehen, wo nach den einzelnen Informationen im Dokument gesucht werden muss.
Nachdem Sie definiert haben, welche Daten aus Ihren Dokumenten extrahiert werden sollen, richten Sie die Dokumentextraktion und -weiterleitung zur menschlichen Überprüfung ein. Entsprechende Informationen finden Sie unter Einrichten der Dokumentextraktion und Weiterleitung an die menschliche Überprüfung.

