Loading
Agentforce 및 Einstein 생성형 AI
목차
필터 선택

          결과 없음
          결과 없음
          몇 가지 검색 팁

          키워드의 맞춤법을 확인하십시오.
          더 일반적인 검색 용어를 사용하십시오.
          필터 수를 줄여 검색 범위를 확장하십시오.

          전체 Salesforce 도움말 검색
          사용자 정의 평가 만들기

          사용자 정의 평가 만들기

          사용자 정의 평가를 통해 정확도, 어조, 브랜드 목소리와 같은 특정 기준에 대해 AI를 테스트할 수 있습니다. 판사로서의 LLM을 사용하면 출력에 자동으로 점수를 매기고 검토하여 에이전트의 응답이 특정 목표 및 품질 표준을 일관되게 충족하는지 확인할 수 있습니다.

          필수 Edition

          녹색 확인 표시

          이 문서는 다음에 적용됩니다.

          Agentforce Builder의 새로운 테스트 센터(베타)
          빨간색 x 표시

          이 문서는 다음에 적용되지 않습니다.

          설정의 레거시 Agentforce 테스트 센터
          지원 제품: Lightning Experience
          지원 제품: Enterprise, Performance, UnlimitedDeveloper Edition 필수 추가 기능 라이센스는 에이전트 유형에 따라 다릅니다.
          필요한 사용자 권한
          테스트 센터에서 테스트 만들기: AI 에이전트 관리 AND 에이전트 유형에 대한 필수 권한

          모든 에이전트에게 목표 또는 목적이 있으므로 에이전트의 성과를 평가하려면 해당 목적에 적합한 메트릭을 식별해야 합니다. 기본 평가와 함께 사용자 정의 평가를 사용하면 간단한 통과 또는 실패 확인 외에 에이전트의 효율성을 평가하는 특정 기준을 정의할 수 있습니다. 사용자 정의 평가를 통해 AI 에이전트가 브랜드 목소리를 일관되게 반영하고 품질 기대를 충족하고 의도한 분위기를 전달하는지 확인할 수 있습니다.

          1. 사용자 정의 평가를 만들려면 사용자 정의 추가를 클릭하고 LLM 판사를 선택합니다.

            LLM 판사란 무엇입니까?

            LLM 판사(또는 LLM-as-judge)는 하나의 대규모 언어 모델(LLM)이 다른 하나의 대규모 언어 모델의 출력을 평가하는 경우입니다. 판사 LLM은 과업을 정의하고 실제 정확도, 관련성, 일관성, 소스에 대한 충성도와 같은 평가 기준을 간략하게 설명하는 프롬프트를 수신합니다. 해당 자원 및 지침을 사용하여 LLM 판사는 예상 응답을 결정하고 에이전트 응답과 비교합니다. 이 비교를 기반으로 판사는 점수, 순위 또는 쓰기 피드백을 생성합니다. 판단 모델로서의 LLM은 요약 점수 매기기 또는 응답 순위 지정과 같은 과업에 대해 확장 가능한 자동화된 목표 평가 도구로 사용됩니다. 가장 정확하고 유용한 테스트 결과를 제공하기 위해 LLM 판사로 프롬프트를 신중하게 설계했습니다.
          2. 사용자 정의 평가를 위한 프롬프트를 만들 때 몇 가지 주요 요소를 맞춤 설정할 수 있습니다.
            • 판사 역할을 하는 AI 모델 결정
            • Salesforce 리소스에 추가
            • 다중 템플릿 버전 저장
            • 통과 기준에 대한 임계값 점수 설정
          3. 평가를 저장합니다.

          사용자 정의 평가를 저장하면 테스트 도구 모음 평가에 자동으로 선택됩니다. 상태가 실행 준비인 경우 테스트를 실행하려면 테스트 실행을 클릭합니다.

           
          로드 중
          Salesforce Help | Article