Définition des données à extraire de vos documents
Les configurations de traitement des documents définissent la structure et les règles d'extraction des données de vos documents. En créant ces configurations, vous définissez les informations à rechercher et comment organiser les données extraites. Cette étape est essentielle avant de traiter des documents dans vos flux ou de configurer des workflows de révision.
Éditions requises
| Disponible avec : Lightning Experience |
| Afficher les éditions prises en charge. |
| Cette fonctionnalité nécessite MuleSoft pour Flux : Complément IDP. Professional Edition nécessite le complément d'accès API. Pour acheter, contactez votre chargé de compte Salesforce. |
| Les fonctionnalités de traitement des documents nécessitent l'activation de l'IA générative Einstein dans Configuration, et Data 360 provisionnée et activée pour votre organisation. |
| MuleSoft pour flux : Les fonctionnalités IDP utilisées avec Agentforce nécessitent l'édition Foundations ou Agentforce 1. Pour acheter ces éditions, contactez votre chargé de compte Salesforce. |
| Autorisations utilisateur requises | |
|---|---|
| Pour créer, lire, modifier et supprimer des configurations de traitement de documents : | Gestion des configurations de traitement des documents |
Avant de définir les données à extraire de vos documents, vérifiez que vous disposez des éléments suivants :
- Exemples de documents du type que vous souhaitez traiter (PDF, images ou documents scannés)
- Une liste des champs de données spécifiques que vous souhaitez extraire de vos documents
- Knowledge des types de données de chaque champ (Texte, Numérique, Devise ou Date)
- Compréhension de la structure et de la présentation du document que vous souhaitez traiter
- Familiarité de base avec Flow Builder (pour les étapes suivantes du workflow)
Créez des configurations de traitement des documents dans l'application Automation afin de définir les instructions et la structure de sortie de chaque type de document à traiter. Vous pouvez charger des documents et tester le processus d'extraction en créant la Configuration de traitement des documents.
- Dans l'application Automatisation, sélectionnez l'onglet Traitement des documents.
- Cliquez sur Nouvelle configuration de traitement des documents.
-
Cliquez sur Charger des fichiers, puis sélectionnez un exemple de document à utiliser comme base pour créer une configuration Traitement des documents.
Cliquez sur Terminé lorsque le chargement est terminé.
-
Cliquez sur Utilisation de l'extraction automatique pour ajouter automatiquement des champs et des tableaux basés sur le document chargé.
Cette approche est recommandée car elle scanne l'exemple de document, et identifie et extrait automatiquement tous les champs trouvés.
- Facultatif :
Si nécessaire, ajoutez manuellement des champs et des tableaux supplémentaires à la configuration.
- Dans le panneau Sorties, cliquez sur Champs, puis sur Ajouter un champ.
- Saisissez Nom, Type de champ (chaîne, numérique, booléen) et éventuellement Instructions d'invite avec des détails supplémentaires qu'Einstein peut prendre en compte pendant le processus d'extraction.
- Cliquez sur Ajouter.
- Continuez à ajouter des champs si nécessaire.
- Pour ajouter des tableaux, dans le panneau Sorties, sélectionnez l'onglet Tableaux.
- Cliquez sur Ajouter un tableau.
- Saisissez Nom, éventuellement Instructions d'invite, puis cliquez sur Ajouter.
- Cliquez sur le nom du tableau, puis sélectionnez l'onglet Colonnes.
- Cliquez sur Ajouter une colonne.
- Saisissez Nom, Type de champ, éventuellement Instructions d'invite, puis cliquez sur Ajouter.
Vous pouvez ajouter des champs et des tableaux manuellement après l'extraction automatique ou choisir de créer la configuration entièrement manuellement en cliquant sur Créer manuellement au lieu d'utiliser l'extraction automatique. -
Cliquez sur Tester pour analyser votre document chargé et afficher les données du tableau extraites.
Les résultats du test affichent les valeurs extraites pour chaque champ et tableau, avec des scores de confiance indiquant la précision de l'extraction.
- Une fois la configuration créée, saisissez un nom pour votre Configuration de traitement des documents, puis cliquez sur Enregistrer.
Votre Configuration de traitement des documents est maintenant enregistrée et prête à être utilisée. La configuration définit tous les champs et types de données à extraire de vos documents. Vous pouvez vérifier que la configuration est terminée en vérifiant que :
- Tous les champs obligatoires sont définis avec les types de données appropriés
- L'analyse de test montre des résultats d'extraction précis
- Les scores de confiance sont acceptables pour votre cas d'utilisation
Cette configuration peut désormais être utilisée dans vos flux avec l'action Extraire les données du document, et vous pouvez créer des infrastructures de révision pour valider les données extraites.
Voici un exemple de configuration de champ pour le traitement des factures :
| Nom du champ | Nom d'API | Type de champ | Instruction d'invite |
|---|---|---|---|
| Nom de la société | CompanyName | Texte | Extraire le nom du fournisseur ou de la société de l'en-tête de la facture |
| Numéro de la commande | OrderNumber | Texte | Recherchez le numéro de facture ou de commande, généralement en haut du document |
| Nom de l'acheteur | PurchaserName | Texte | Extraire le nom du client ou de l'acheteur de la section de facturation |
| Total | TotalAmount | Devise | Trouver le montant total dû, généralement en bas de la facture |
| Taxe | TaxAmount | Devise | Extraire le montant de taxe s'il est répertorié séparément |
Cet exemple montre comment structurer des définitions de champ pour des données de facture courantes. Les instructions de l'invite aident Einstein à comprendre où rechercher chaque information du document.
Après avoir défini les données à extraire de vos documents, configurez l'extraction de documents et l'acheminement vers un examen humain. Consultez Configuration de l'extraction de documents et de l'acheminement vers l'examen humain.

