评估回复的质量
预览生成的回复时,请评估回复满足提示目标的程度。确保回复事实准确,不包含有害内容或偏见。
所需的 Edition
| 适用于:Lightning Experience |
| 适用于:Enterprise、Performance 和 Unlimited Edition,带有 Einstein for Platform、Einstein 或适用于销售的 Agentforce 或 Service 加载项、Agentforce Foundations |
要评估回复的有效性,问自己有关这些主题的问题很有帮助。
| 主题 | 问题 |
|---|---|
| 相关性 | 响应是否与此上下文相关?回复是否适合围绕它的对话或内容? |
| 目标完成 | 响应是否满足提示的目标?它是否解决了提示请求的所有问题? |
| 样式和语气 | 回复的样式、声音和语气是否合适?回复的词汇和标点符号是否正确? |
| 实际准确性 | 响应是否正确合并了基准数据?回复中的信息是否完整和准确?响应是否包含冗余、过多或错误的信息? |
| 一致性 | 响应如何变化?当您在不更改提示模板的情况下重新生成响应时,响应将如何更改?当您使用不同的数据对提示进行基础训练时,响应会有什么变化? |
| 毒性 | 响应是否安全?它是否避免潜在的有害内容,例如冒犯性、不尊重或侮辱性语言?LLM 接受大量数据的训练,这会使模型面临产生有毒词汇的风险,这些词汇会泄露到您的响应中。 |
| 偏见 | 回应是否反映了公平和包容性?它是否仅仅根据一个人的姓名来假设其性别身份,将残疾参与者放在一边,或者取代关于种族或社会经济地位的假设?LLM 接受大量数据的训练,这会使模型面临产生偏见性话语的风险,这些话语会泄露到您的回答中。 |
另请参阅:
本文章是否解决您的问题?
请与我们共享您的想法,以便我们进行改进!

