Velge vurderinger
Evalueringer måler AI-agentens ytelse på tvers av viktige områder. Standard evalueringer inkluderer svarnøyaktighet, emnedeklarasjon og handlingsdeklarasjon. For å samsvare med testmålene bedre kan du legge til kvalitetsfokuserte vurderinger som fullstendighet, sammenheng, presisjon, latens og overholdelse av instruksjoner. Når du velger den riktige blandingen av evalueringer, får du innsikten du trenger for å strategisk avgrense og forbedre agenten.
Nødvendige utgaver
![]() Denne artikkel gjelder for: |
Tidligere Agentforce-testsenter i Oppsett |
![]() Denne artikkelen gjelder ikke for: |
Nytt testsenter i Agentforce Builder (beta) |
| Tilgjengelig i Lightning Experience |
| Tilgjengelig i Enterprise, Performance, Unlimited og Developer Edition. Nødvendige tilleggslisenser varierer etter agenttype. |
| Nødvendige brukertillatelser | |
|---|---|
| For å opprette tester i Testing Center: | Behandle AI-agenter OG de nødvendige tillatelsene for agenttypen |
-
Velg evalueringene du vil kjøre testen. Standard evalueringer testes alltid, men du kan velge Svarkvalitetsmålinger for å fokusere testene på bestemte områder. Vurderinger av responskvalitet måler Agentforce-testsenterets tre viktigste kvalitetskriterier: nøyaktighet (riktig informasjon), relevans (behandling av hensikt og kontekst) og tale og tone (vurdering av stil og merkeprofileringsjustering).
Vurdering Definisjon Standardvurderinger Svarvurdering Vi sender testytelsen til agenten og registrerer svaret. En LLM-dommer bestemmer det forventede svaret, sammenligner det med agentens svar og tildeler en score. Emnedeklarasjon AI-genererte testytringer er utformet for å utløse at agenten velger sine tildelte emner. Så emnedeklarasjonsvurderingen bestemmer om agenten har valgt de riktige emnene basert på ytringen. Handlingsdeklarasjon På samme måte som emnedeklarasjonen er AI-genererte test-utteranser utformet for å utløse agenten til å velge bestemte handlinger. Handlingdeklarasjonen kontrollerer at agenten velger de riktige handlingene og inkluderer alle forventede handlinger basert på ytringen. Vurderinger av svarkvalitet Fullstendighet Kontrollerer om agenten dekket det ønskede innholdet tilstrekkelig, inkludert all viktig informasjon som forventes fra ytringen. Koherens Vurderer om svaret ble transformert til grammatisk riktig samtalespråk. For eksempel hvis informasjon har blitt tatt fra Salesforce-objekter og levert som rådata som JSON-strukturer. Kortfattet Evaluerer om svaret er kort, men nøyaktig. Latens Testeutførelsestid, målt i millisekunder. Instruksjonsoverholdelse Kontrollerer hvor godt agenten tolker og fullstendig følger emneinstruksjonene, tar opp viktige punkter og gir nødvendig informasjon. Lær mer om instruksjonsoverholdelse i Hjelp. - Se gjennom testvalgene dine og klikk på Lagre og kjør. Generering av tester bruker kreditter, så forsikre deg om at du er fornøyd med konfigurasjonen før du kjører.
Når Agentforce er ferdig med å generere testene, vises de i Testing Center. Når statusen er Klar til å kjøre, klikker du direkte på Kjør tester for å kjøre testene, eller last dem ned som en CSV-fil for å gjøre redigeringer. Etter redigering laster du opp CSV-filen tilbake til Testing Center for å kjøre tester på de oppdaterte sakene.
Generativ AI kan generere testtilfeller for Konto-, Salgsemne-, Salgsmulighet- og Kontakt-objekter. Med spesifikke instruksjoner i beskrivelsen kan den også opprette testtilfeller for tilpassede objekter og handlingen Svar på spørsmål med Knowledge. For tilpassede objekter kan du for eksempel bruke en beskrivelse på samme måte: "Generer testtilfeller for [navn på tilpasset objekt]. Eksempler på ytringer er: [eksempel på ytring relatert til tilpasset objekt], [eksempel på ytring relatert til tilpasset objekt]." Hvis du vil at AI skal opprette testtilfeller for handlingen Svarspørsmål med Knowledge, bruker du en beskrivelse som dette: Generer testtilfeller for handlingen Svar på spørsmål med Knowledge. Bruk følgende Knowledge til å generere tester: [tittel på en artikkel], [tittel på en artikkel]."



