Vous êtes ici :
Alerte Valeurs aberrantes
Les valeurs aberrantes sont des points de données qui diffèrent significativement de la majorité dans un jeu de données. L'alerte indique qu'au moins une valeur aberrante a été détectée et qu'il y a une présence d'un nombre exceptionnellement petit ou grand. Les valeurs aberrantes peuvent fausser les performances du modèle, réduire la précision et entraîner des prévisions incorrectes.
Actions à considérer
Il existe deux types de valeurs aberrantes.
- valeurs incorrectes dues à des erreurs de saisie de données, des erreurs de traitement ou d'autres problèmes.
- valeurs correctes qui reflètent un événement extraordinaire, non récurrent ou peu fréquent.
Déterminez les valeurs aberrantes à conserver et celles à exclure de votre modèle. Excluez les valeurs incorrectes et pensez à les corriger avant l'entraînement du modèle.
Méthodologie de détection
Pour une variable, Générateur de modèle :
- calcule la moyenne globale et l'écart type global de ses valeurs.
- désigne une valeur aberrante comme toute valeur supérieure ou inférieure à cinq écarts types par rapport à la moyenne globale.
Exemple
Un détaillant souhaite prédire les ventes unitaires de différents produits. Pour ce faire, le détaillant élabore un modèle de régression avec les variables d’entrée ci-dessous.
- ID de produit
- prix unitaire
- Jour de la semaine
- emplacement du magasin
- Disponibilité du stock
- prix unitaire concurrent
- Événement promotionnel
Après l'entraînement du modèle, une alerte s'affiche, car un score aberrant élevé est détecté pour un produit. La plupart des produits se vendent entre 10 et 100 unités par jour, mais les enregistrements indiquent des ventes supérieures à 1000 unités par jour. Pour résoudre le problème, voici quelques mesures à prendre.
- Retirez les points de données qui peuvent avoir résulté d'erreurs.
- Incluez le score aberrant pendant l'entraînement pour aider le modèle à apprendre des modèles qui indiquent des montants de vente réguliers. Utilisez ensuite les données pour identifier les transactions qui s'écartent sensiblement de la norme.
- Réentraînez le modèle avec un jeu de données mis à jour.

