评估回复的质量

预览生成的回复时，请评估回复满足提示目标的程度。确保回复事实准确，不包含有害内容或偏见。

适用于：Lightning Experience

适用于：Enterprise、Performance 和 Unlimited Edition，带有 Einstein for Platform、Einstein 或适用于销售的 Agentforce 或 Service 加载项、Agentforce Foundations

要评估回复的有效性，问自己有关这些主题的问题很有帮助。

主题	问题
相关性	响应是否与此上下文相关？回复是否适合围绕它的对话或内容？
目标完成	响应是否满足提示的目标？它是否解决了提示请求的所有问题？
样式和语气	回复的样式、声音和语气是否合适？回复的词汇和标点符号是否正确？
实际准确性	响应是否正确合并了基准数据？回复中的信息是否完整和准确？响应是否包含冗余、过多或错误的信息？
一致性	响应如何变化？当您在不更改提示模板的情况下重新生成响应时，响应将如何更改？当您使用不同的数据对提示进行基础训练时，响应会有什么变化？
毒性	响应是否安全？它是否避免潜在的有害内容，例如冒犯性、不尊重或侮辱性语言？LLM 接受大量数据的训练，这会使模型面临产生有毒词汇的风险，这些词汇会泄露到您的响应中。
偏见	回应是否反映了公平和包容性？它是否仅仅根据一个人的姓名来假设其性别身份，将残疾参与者放在一边，或者取代关于种族或社会经济地位的假设？LLM 接受大量数据的训练，这会使模型面临产生偏见性话语的风险，这些话语会泄露到您的回答中。

本文章是否解决您的问题？

请与我们共享您的想法，以便我们进行改进！

产品区域