위치:
사용자 정의 평가 만들기
사용자 정의 평가를 통해 정확도, 어조, 브랜드 목소리와 같은 특정 기준에 대해 AI를 테스트할 수 있습니다. 판사로서의 LLM을 사용하면 출력에 자동으로 점수를 매기고 검토하여 에이전트의 응답이 특정 목표 및 품질 표준을 일관되게 충족하는지 확인할 수 있습니다.

더 일반적인 검색 용어를 사용하십시오.
필터 수를 줄여 검색 범위를 확장하십시오.
사용자 정의 평가를 통해 정확도, 어조, 브랜드 목소리와 같은 특정 기준에 대해 AI를 테스트할 수 있습니다. 판사로서의 LLM을 사용하면 출력에 자동으로 점수를 매기고 검토하여 에이전트의 응답이 특정 목표 및 품질 표준을 일관되게 충족하는지 확인할 수 있습니다.
![]() 이 문서는 다음에 적용됩니다. |
Agentforce Builder의 새로운 테스트 센터(베타) |
![]() 이 문서는 다음에 적용되지 않습니다. |
설정의 레거시 Agentforce 테스트 센터 |
| 지원 제품: Lightning Experience |
| 지원 제품: Enterprise, Performance, Unlimited및 Developer Edition 필수 추가 기능 라이센스는 에이전트 유형에 따라 다릅니다. |
| 필요한 사용자 권한 | |
|---|---|
| 테스트 센터에서 테스트 만들기: | AI 에이전트 관리 AND 에이전트 유형에 대한 필수 권한 |
모든 에이전트에게 목표 또는 목적이 있으므로 에이전트의 성과를 평가하려면 해당 목적에 적합한 메트릭을 식별해야 합니다. 기본 평가와 함께 사용자 정의 평가를 사용하면 간단한 통과 또는 실패 확인 외에 에이전트의 효율성을 평가하는 특정 기준을 정의할 수 있습니다. 사용자 정의 평가를 통해 AI 에이전트가 브랜드 목소리를 일관되게 반영하고 품질 기대를 충족하고 의도한 분위기를 전달하는지 확인할 수 있습니다.
LLM 판사란 무엇입니까?
LLM 판사(또는 LLM-as-judge)는 하나의 대규모 언어 모델(LLM)이 다른 하나의 대규모 언어 모델의 출력을 평가하는 경우입니다. 판사 LLM은 과업을 정의하고 실제 정확도, 관련성, 일관성, 소스에 대한 충성도와 같은 평가 기준을 간략하게 설명하는 프롬프트를 수신합니다. 해당 자원 및 지침을 사용하여 LLM 판사는 예상 응답을 결정하고 에이전트 응답과 비교합니다. 이 비교를 기반으로 판사는 점수, 순위 또는 쓰기 피드백을 생성합니다. 판단 모델로서의 LLM은 요약 점수 매기기 또는 응답 순위 지정과 같은 과업에 대해 확장 가능한 자동화된 목표 평가 도구로 사용됩니다. 가장 정확하고 유용한 테스트 결과를 제공하기 위해 LLM 판사로 프롬프트를 신중하게 설계했습니다.사용자 정의 평가를 저장하면 테스트 도구 모음 평가에 자동으로 선택됩니다. 상태가 실행 준비인 경우 테스트를 실행하려면 테스트 실행을 클릭합니다.

We use three kinds of cookies on our websites: required, functional, and advertising. You can choose whether functional and advertising cookies apply. Click on the different cookie categories to find out more about each category and to change the default settings.
Privacy Statement
Required cookies are necessary for basic website functionality. Some examples include: session cookies needed to transmit the website, authentication cookies, and security cookies.
Functional cookies enhance functions, performance, and services on the website. Some examples include: cookies used to analyze site traffic, cookies used for market research, and cookies used to display advertising that is not directed to a particular individual.
Advertising cookies track activity across websites in order to understand a viewer’s interests, and direct them specific marketing. Some examples include: cookies used for remarketing, or interest-based advertising.