Loading
Agentforce et IA générative Einstein
Table des matières
Sélectionner des filtres

          Aucun résultat
          Aucun résultat
          Voici quelques conseils de recherche

          Vérifiez l'orthographe de vos mots-clés.
          Utilisez des termes de recherche plus généraux.
          Sélectionnez moins de filtres pour élargir votre recherche.

          Recherchez dans toute l’aide de Salesforce
          Création d'évaluations personnalisées

          Création d'évaluations personnalisées

          Les évaluations personnalisées aident à tester votre IA par rapport à des critères spécifiques tels que la précision, le ton et la voix de la marque. En utilisant un LLM-as-judge, vous pouvez automatiquement calculer le score et examiner les sorties pour vous assurer que les réponses de vos agents répondent de façon cohérente à vos objectifs spécifiques et à vos normes de qualité.

          Éditions requises

          coche verte

          Cet article s'applique :

          Nouveau centre de test dans Agentforce Builder (bêta)
          coche rouge

          Cet article ne s'applique pas :

          Centre de test Agentforce hérité dans Configuration
          Disponible avec : Lightning Experience
          Disponible avec : Enterprise Edition, Performance Edition, Unlimited Edition et Developer Edition. Les licences complémentaires requises varient selon le type d'agent.
          Autorisations utilisateur requises
          Pour créer des tests dans le Centre de test : Gérer les agents IA ET les autorisations requises pour votre type d'agent

          Chaque agent a un but ou un objectif. Par conséquent, l'évaluation des performances d'un agent nécessite d'identifier des métriques adaptées à cet objectif. Outre les évaluations par défaut, les évaluations personnalisées permettent de définir des critères spécifiques pour évaluer l'efficacité de votre agent au-delà des simples contrôles de réussite ou d'échec. Avec des évaluations personnalisées, vous pouvez vérifier que vos agents IA reflètent de façon cohérente la voix de votre marque, répondent aux attentes de qualité et renvoient le sentiment voulu.

          1. Pour créer une évaluation personnalisée, cliquez sur Ajouter personnalisé, puis sélectionnez Juge LLM.

            Qu’est-ce qu’un juge LLM ?

            Un LLM judge (ou LLM-as-judge) est quand un grand modèle de langage (LLM) évalue les sorties d'un autre. Un juge LLM reçoit une invite qui définit la tâche et décrit les critères d'évaluation tels que l'exactitude factuelle, la pertinence, la cohérence et la fidélité à la source. Avec ces ressources et lignes directrices, le juge du grand livre détermine la réponse attendue et la compare à la réponse de l'agent. Sur la base de cette comparaison, le juge génère des scores, des classements ou des commentaires écrits. Le modèle LLM en tant que juge sert d'outil d'évaluation évolutif, automatisé et objectif pour des tâches telles que les résumés de score ou le classement des réponses. Nous avons soigneusement conçu nos invites LLM-as-judge pour vous donner les résultats de test les plus précis et les plus utiles.
          2. Lorsque vous créez une invite pour une évaluation personnalisée, vous pouvez adapter plusieurs éléments clés.
            • Déterminer quel modèle IA sert de juge
            • Ajouter des ressources Salesforce
            • Enregistrer plusieurs versions de modèle
            • Définir le score de seuil pour vos critères de réussite
          3. Enregistrez votre évaluation.

          Après avoir enregistré votre évaluation personnalisée, elle est automatiquement sélectionnée pour vos évaluations de suite de tests. Lorsque le statut est Prêt à exécuter, cliquez sur Exécuter les tests pour exécuter les tests.

           
          Chargement
          Salesforce Help | Article