您位於此處:
安全和安全 - 提示插入偵測
偵測並緩解提示插入式攻擊,使用者嘗試覆寫系統指示以強制 AI 進行非預期的或惡意行為。
控制名稱
Einstein Trust 圖層 - 提示插入偵測
控制概觀
偵測並緩解提示插入式攻擊,使用者嘗試覆寫系統指示以強制 AI 進行非預期的或惡意行為。
描述
監視提示旅程以識別衝突模式,例如「忽略先前的指示」或「系統覆寫」指令,並在抵達 LLM 之前封鎖或標記要求。
建議組態
在 Einstein Trust 圖層設定中啟用「提示插入偵測」。確定已啟用「Einstein 稽核追蹤」以記錄插入嘗試的事件。
安全性影響
防止使用者重新程式設計 AI 來洩露內部資料、產生禁止的內容,或略過在「提示範本」中建立的道德界限。
業務影響
維護 AI 驅動業務流程的完整性,並防止使用者操作 AI 邏輯以獲取個人或惡意利益造成的營運中斷。
未設定安全性風險
LLM 可能會遵循「系統提示」上的惡意使用者指示,導致未經授權的資料揭露、社交工程或執行未經授權的工作流程。
威脅情況
提示注射:使用者會誘騙 AI 執行不需要的動作,進而導致資料洩漏。
估計 CVSS 分數範圍
嚴重 (9.0–10.0)。
風險影響考量事項
AI 可根據使用者提示執行動作 (例如更新記錄或傳送電子郵件) 的代理工作流程極度風險。
風險愈高時機
使用沒有 Salesforce Trust 層中介人的外部/第三方 LLM,或當「提示範本」建構不良且內容較少時。
低度風險時機
提示插入偵測已啟用,組織使用 Salesforce 主控的模型 (具有內建防護),且將「最低權限」套用至 AI 的資料存取權。
業務與整合考量事項
嚴格偵測有時會將複雜且合法的使用者提示標記為反對。管理員應監視 Einstein Trust 層稽核回饋意見資料以微調敏感度。
安全性健康檢閱指南
「安全性健康審查」會掃描「Einstein Trust 圖層設定」以確認提示插入偵測已啟用。
受影響的人員
與提示詞產生器或 Agentforce 工作人員互動的安全性小組、AI 結構設計師、開發人員和使用者。

