Q70 — AWS AIF-C01 第1章

第 70/100 問 | ← 第1章

ある企業が、顧客サービス向けチャットボットを構築しようとしています。このチャットボットは、過去のインタラクションおよびオンラインリソースを学習することで、自身の応答を改善することを希望しています。このような自己改善能力を提供するAI学習戦略はどれですか?

正解: B. 顧客の肯定的フィードバックに基づく報酬を与える強化学習

解説

本問は、AI学習戦略の理解を問うものです。問題文では、チャットボットが過去のインタラクションおよびオンラインリソースを学習して応答を改善することを求めています。これは、経験に基づいて行動を最適化する戦略を指します。選択肢Aの教師あり学習は、事前にラベル付けされたデータセットに依存し、実際のインタラクションを通じた自己改善には向いていません。選択肢Bの強化学習は、報酬またはペナルティのメカニズムを通じて行動を最適化し、事前にラベル付けされたデータなしで実際のインタラクションから学習・改善することが可能です。選択肢Cの教師なし学習は、データ内のパターンやクラスタの発見に用いられ、応答品質の改善には直接関係しません。選択肢DはFAQデータベースの更新に焦点を当てており、インタラクションからの自己改善には不十分です。したがって、正解は選択肢B「顧客の肯定的フィードバックに基づく報酬を与える強化学習」です。