Q86 — AWS AIF-C01 第3章

第 86/100 問 | ← 第3章

ある企業が、報酬に基づくフィードバックを用いた強化学習(RLHF)を活用して、AIアプリケーションに人間中心の設計を適用しています。同社は、人間によるフィードバックを含む信頼性の高いトレーニングデータセットを作成し、開発中の大規模言語モデル(LLM)の性能向上を図りたいと考えています。この要件を満たすソリューションはどれですか?

正解: B. Amazon SageMaker Ground Truthを使用する

解説

信頼性の高いトレーニングデータセットを構築し、人間によるフィードバックをLLMの改善に活用する際、人間の判断やアノテーションを必要とするデータを効率的かつスケーラブルに収集・処理することが鍵となります。Amazon SageMaker Ground Truthは、高品質かつスケーラブルな機械学習トレーニングデータセットの構築を容易にするサービスであり、特に人間の判断を必要とするデータに適しています。SageMaker Ground Truthを用いることで、企業は人間によるフィードバックを収集し、RLHFなどの強化学習モデルのトレーニングに活用し、LLMの性能を向上させることができます。