Du er her:
Sikkerhet og sikkerhet – ledetekst av injeksjon
Oppdager og avverger meldingsinnsettingsangrep der brukere forsøker å overskrive systeminstruksjoner for å tvinge AI til utilsiktet eller skadelig virkemåte.
Navn på kontroll
Einstein Trust Layer - Deteksjon av ledetekstinnsetting
Oversikt over kontroll
Oppdager og avverger meldingsinnsettingsangrep der brukere forsøker å overskrive systeminstruksjoner for å tvinge AI til utilsiktet eller skadelig virkemåte.
Beskrivelse
Overvåker ledetekstreisen for å identifisere motstandsmønstre, som "ignorere tidligere instruksjoner" eller "systemoverstyring"-kommandoer, og blokkerer eller flagger forespørselen før den når LLM.
Anbefalt konfigurasjon
Aktiver "Prompt injeksjonsdeteksjon" i innstillingene for Einstein Trust Layer. Forsikre deg om at Einstein er aktivert for å logge hendelser for innsettingsforsøk.
Innvirkning på sikkerhet
Hindrer at AI omprogrammeres av en bruker for å lekke interne data, generere forbudt innhold eller omgå de etiske grensene som er angitt i ledetekstmalen.
Forretningsinnvirkning
Opprettholder integriteten til AI-drevne forretningsprosesser og hindrer driftsforstyrrelser forårsaket av brukere som manipulerer AI-logikk for personlig eller skadelig gevinst.
Sikkerhetsrisiko hvis ikke konfigurert
LLM kan følge skadelige brukerinstruksjoner over Systemledeteksten, som fører til uautorisert datautlevering, sosial engineering eller utføring av uautoriserte arbeidsflyter.
Trusselscenarier
Ledetekstinntak: En bruker lurer AI til å utføre uønskede handlinger som fører til datalekkasje.
Beregnet CVSS Score-område
Kritisk (9.0–10.0).
Viktige punkter om risikoinnvirkning
Ekstrem risiko for agentiske arbeidsflyter der AI kan utføre handlinger (for eksempel oppdatere poster eller sende e-postmeldinger) basert på brukermeldinger.
Høyere risiko når
Bruk av eksterne/tredjeparts LLM-er uten Salesforce Trust Layer-mellomleverandøren, eller når ledetekstmaler er dårlig konstruert med minst kontekst.
Lav risiko når
Deteksjon av ledetekstinnsetting er aktiv, organisasjonen bruker Salesforce-driftede modeller (som har innebygd forsvar), og Minste rettighet brukes på AI-ens datatilgang.
Viktige punkter om virksomheten og integrasjonen
Streng deteksjon kan av og til flagge komplekse, legitime brukermeldinger som motstridende. Administratorer bør overvåke tilbakemeldingsdata for Einstein Trust Layer-revisjon for å finjustere sensitiviteten.
Veiledning for vurdering av sikkerhetstilstand
Sikkerhetstilstandsvurdering skanner oppsettet for Einstein Trust for å bekrefte at deteksjon av ledetekstinnsetting er aktivert.
Hvem berøres
Sikkerhetsteam, AI-arkitekter, utviklere og sluttbrukere som samhandler med Ledetekstbygger eller Agentforce.

