Vous êtes ici :
Premiers pas avec la préparation de données
Une préparation des données de qualité est essentielle pour la réussite des implémentations de solutions contrôlées par Einstein Discovery.
Qu'est-ce que la Préparation des données ?
La Préparation des données consiste à optimiser vos données pour Einstein Discovery :
- analyser et générer des connaissances utiles dans vos données
- entraîner des modèles qui dérivent des prédictions et des améliorations utiles pour prendre des décisions métiers et améliorer les résultats
La préparation des données consiste à agréger et à optimiser les données associées à la variable de résultat que vous recherchez, ainsi que les variables explicatives potentielles qui peuvent influencer le résultat. La préparation des données est également un processus d'amélioration itératif. Plus vous explorez vos données, plus vous recueillez de connaissances. Les enseignements découverts peuvent entraîner une réévaluation des hypothèses antérieures et un ajustement en conséquence de votre implémentation de la préparation des données.
Investissement dans la préparation des données pour votre solution
Généralement, les scientifiques de données consacrent du temps et des efforts importants à la planification et à la préparation de leur données. Ils savent que la qualité de la sortie dépend de la conception et de la qualité de l'entrée.
Vous n'allez peut-être pas égaler l'expertise, les compétences et la formation des scientistes des données dans le processus de préparation des données, mais vous pouvez réussir si vous :
- connaissez le domaine des données associées au résultat métier que vous essayez d'optimiser
- utilisez les capacités étendues d’intégration de données de CRM Analytics pour agréger, mettre à jour et compléter le jeu de données avec des données optimisées pour l’analyse
- appliquez des techniques courantes de préparation des données pour générer des données de grande qualité précises, complètes et représentatives de vos opérations métiers et pertinentes pour votre solution
Même si vous n'êtes pas un scientifique des données, vous pouvez améliorer vos résultats en appliquant des principes de base pour faciliter l'implémentation de votre solution.
Utilisation des capacités d'intégration de données de CRM Analytics
Einstein Discovery dépend des données stockées dans les jeux de données CRM Analytics. CRM Analytics fournit divers outils puissants que vous pouvez utiliser pour préparer (extraire, charger et transformer) vos données. Vous pouvez ainsi remplir un jeu de données avec des informations optimisées pour être consommées par Einstein Discovery. Pour plus d'informations, consultez Intégration et préparation des données pour l'analyse, notamment Premiers pas avec l'intégration de données.
Simplification de la préparation des données avec Einstein Discovery
Einstein Discovery offre les capacités suivantes pour vous aider à améliorer les données à analyser :
- Des alertes de qualité vous informent quand Einstein Discovery détecte un problème éventuel dans vos données. Vous pouvez remédier aux problèmes de données de deux façons :
- corriger le problème dans votre jeu de données CRM Analytics en utilisant des outils de préparation des données qui automatisent la résolution
- corriger le problème dans votre modèle en utilisant les paramètres du modèle
- La sélection de fonctionnalités consiste à choisir les variables explicatives à inclure dans votre modèle. L'idéal est d'inclure dans votre modèle une série optimisée de variables explicatives qui justifient le plus précisément possible les variations dans la variable de résultat. En utilisant la sélection de fonctionnalité automatisée et les corrélations identifiées dans vos données, Einstein Discovery peut suggérer les variables à inclure, ou à omettre, dans votre modèle. Vous pouvez ainsi orienter vos efforts de préparation des données sur les variables que vous analysez.
- Si certaines observations ne remplissent pas vos critères de filtrage, les filtres permettent de les exclure sélectivement d'un modèle. Par exemple dans les paramètres du modèle, vous pouvez spécifier des chiffres et des plages de dates, et omettre des catégories de l'analyse.
- Les transformations permettent de corriger les problèmes de données dans votre modèle. Par exemple, la correspondance partielle permet d'améliorer les regroupements de catégories en corrigeant les variations orthographiques dans les valeurs de catégorie.
Préparation des données et amélioration itérative
La préparation des données n'est pas un processus à une seule étape. En fait, la première série de données que vous produisez exposera probablement divers problèmes que vous devez résoudre : valeurs manquantes, valeurs incorrectes, valeurs aberrantes correctes ou incorrectes, informations redondantes à éliminer et autres défis. Fort heureusement, CRM Analytics et Einstein Discovery offrent des capacités étendues d'analyse de vos données, d'identification et de résolution des problèmes, et de production de données optimisées, le tout sans écrire une seule ligne de code. Vous pouvez également automatiser le processus de nettoyage à l'aide de recettes, de flux de données, de planificateurs de tâche et de transformations afin d'appliquer les mêmes corrections aux nouvelles données.
La préparation des données peut continuer une fois votre solution déployée. À mesure que de nouvelles connaissances sont recueillies, il est courant d'expérimenter en ajoutant ou en modifiant les aspects des données saisies. Vous pouvez planifier l'analyse pour ajouter progressivement de nouvelles données à votre modèle. Il est également fréquent de mettre à jour périodiquement les variables et les champs de votre modèle avec de nouvelles informations ou des questions métiers plus précises.

