Vous êtes ici :
Sûreté et sécurité - Contrôle de la détection par injection d'invites
Détecte et atténue les attaques par injection rapide lorsque les utilisateurs tentent de remplacer les instructions système pour forcer l'IA à adopter des comportements involontaires ou malveillants.
Nom du contrôle
Einstein Trust Layer - Détection de l'injection d'invites
Vue d'ensemble du contrôle
Détecte et atténue les attaques par injection rapide lorsque les utilisateurs tentent de remplacer les instructions système pour forcer l'IA à adopter des comportements involontaires ou malveillants.
Description
Surveille le parcours d'invite pour identifier les modèles contradictoires, tels que les commandes « ignorer les instructions précédentes » ou « remplacement système », bloquant ou marquant la requête avant qu'elle n'atteigne le grand livre.
Configuration recommandée
Activez « Détection de l'injection d'invites » dans les paramètres de la couche de Trust Einstein. Assurez-vous que le Journal d'audit Einstein est activé pour consigner les événements des tentatives d'injection.
Impact sur la sécurité
Empêche l'IA d'être reprogrammée par un utilisateur pour fuiter des données internes, générer des contenus interdits ou contourner les frontières éthiques établies dans le modèle d'invite.
Impact commercial
Préserve l’intégrité des processus métiers pilotés par l’IA et empêche les interruptions opérationnelles causées par la manipulation de la logique IA par des utilisateurs à des fins personnelles ou malveillantes.
Risque de sécurité s'il n'est pas configuré
Le LLM peut suivre des instructions utilisateur malveillantes sur l'invite système, entraînant une divulgation de données non autorisée, une ingénierie sociale ou l'exécution de workflows non autorisés.
Scénarios de menace
Injection d'invite : Un utilisateur trompe l'IA en exécutant des actions indésirables, entraînant une fuite de données.
Plage de score CVSS estimée
Critique (9,0 à 10,0).
Considérations relatives à l'impact sur le risque
Risque extrême pour les workflows agents dans lesquels l'IA peut exécuter des actions (par exemple, mettre à jour des enregistrements ou envoyer des e-mails) basées sur des invites utilisateur.
Risque plus élevé quand
Utilisation de LLM externes/tiers sans intermédiaire Salesforce Trust Layer, ou lorsque les Modèles d'invite sont mal construits avec le moins de contexte.
Risque faible quand
La détection de l'injection d'invites est active, l'organisation utilise des modèles hébergés par Salesforce (qui ont une défense intégrée) et le moindre privilège est appliqué à l'accès aux données de l'IA.
Considérations relatives à l'entreprise et à l'intégration
Une détection stricte peut occasionnellement marquer des invites utilisateur complexes et légitimes comme contradictoires. Les administrateurs doivent surveiller les données des commentaires d'audit de la couche Einstein Trust pour ajuster la sensibilité.
Guide d'examen sanitaire de sécurité
Security Health Review analyse la configuration de la couche Einstein Trust pour confirmer que la détection rapide de l'injection est activée.
Qui est impacté
Équipes de sécurité, architectes IA, développeurs et utilisateurs finaux interagissant avec Générateur de répliques ou agents Agentforce.

