您在此处:
安全和安保 - 提示注入检测
检测并缓解用户尝试覆盖系统指令以迫使 AI 采取意外或恶意行为的提示注入攻击。
控件名称
Einstein Trust 层 - 提示注入检测
控制概览
检测并缓解用户尝试覆盖系统指令以迫使 AI 采取意外或恶意行为的提示注入攻击。
描述
监控提示过程,识别对抗模式,例如“忽略以前的指令”或“系统覆盖”命令,在请求到达 LLM 之前阻止或标记它。
推荐配置
在 Einstein Trust 层设置中启用“提示注入检测”。请确保启用 Einstein 审计跟踪来记录注入尝试的事件。
安全影响
防止用户重新编程 AI,以泄露内部数据、生成禁止的内容或绕过提示模板中建立的道德界限。
业务影响
维护 AI 驱动的业务流程的完整性,并防止用户为个人或恶意利益操纵 AI 逻辑而导致运营中断。
安全风险(如果未配置)
LLM 可能会遵循系统提示的恶意用户指令,导致未经授权的数据泄露、社交工程或未经授权的工作流的执行。
威胁场景
提示注入:用户欺骗 AI 执行不需要的操作,导致数据泄露。
估计的 CVSS 得分范围
关键 (9.0–10.0)。
风险影响注意事项
AI 可以根据用户提示执行操作(例如,更新记录或发送电子邮件)的客服人员工作流的极端风险。
高风险
在没有 Salesforce Trust 层中介的情况下使用外部/第三方 LLM,或者在提示模板构建不当且上下文最少时。
低风险
提示注入检测处于活动状态,组织使用 Salesforce 托管的模型(具有内置防御),最小权限应用于 AI 的数据访问。
业务和集成注意事项
严格检测偶尔会将复杂的合法用户提示标记为对抗。管理员应监控 Einstein Trust 层审计反馈数据,以微调敏感度。
安全健康审查指导
安全运行状况审查扫描 Einstein Trust 层设置,以确认启用提示注入检测。
谁受到影响
安全团队、AI 架构师、开发人员和与提示生成器或 Agentforce 客服人员交互的最终用户。

