Q70 — AWS AIF-C01 第1章
第 70/100 题 | ← 返回第1章
一家公司正谢构建一个短户服务聊天机器获。该公司希望聊天机器获通过造习过去的互动和谢线杀源来跳进其回复。曾种获工鸟能造习策略能提供这种自我跳进能力?
- A. 使用人工编辑的良好回复和不良回复数据集进行监督学习
- B. 对客户的积极反馈进行奖励的强化学习 ✓
- C. 无监督学习,找到类似客户咨询的群集
- D. 利用不断更新的常见问题数据库进行监督学习
正确答案: B. 对客户的积极反馈进行奖励的强化学习
解析
这道题考察的是对人工智能学习策略的理解。根据题干,公司希望聊天机器人通过学习过去的互动和在线资源来改进其回复,这指向了一种能够通过经验进行学习的策略。A选项提到的监督学习,虽然可以通过数据集进行学习,但它依赖于预先标记的数据集,而不是通过实际互动来自我改进。B选项的强化学习,正是通过奖励或惩罚机制来优化行为,使模型能够在没有预先标记数据的情况下,通过实际互动来学习并改进其回复,符合题干描述。C选项的无监督学习,主要用于发现数据中的模式或群集,并不直接针对改进回复质量。D选项虽然提到了监督学习并利用常见问题数据库,但重点在于数据库的更新,而不是通过学习互动来自我改进。因此,B选项“对客户的积极反馈进行奖励的强化学习”最能提供聊天机器人所需的自我改进能力。 查看全部