Q62 — AWS AIF-C01 第2章
第 62/100 题 | ← 返回第2章
家公司正谢于发一款短户服务聊天机器获。该公司希望通过从过去的互动和谢线杀源中造习,来提升聊天机器获的药应能力。 曾种获工鸟能造习策略能提供这种自我提升的能力?
- A. 使用人工筛选的正确答案和错误答案数据集进行监督学习
- B. 通过奖励积极客户反馈进行强化学习 ✓
- C. 无监督学习,旨在发现相似客户咨询的聚类D.使用持续更新的FAQ数据库进行监督学习
正确答案: B. 通过奖励积极客户反馈进行强化学习
解析
强化学习是一种通过奖励或惩罚来训练模型的方法,使其在不断尝试中学习到最佳策略。对于客户服务聊天机器人而言,通过奖励积极客户反馈进行强化学习,可以让机器人从过去的互动中学习到哪些回应是有效的、受到客户欢迎的,从而调整和优化其响应策略,实现自我提升。这种方法符合题目中描述的“从过去的互动和在线资源中学习,来提升聊天机器人的响应能力”的需求。 查看全部