ある企業が、報酬に基づくフィードバックを用いた強化学習（RLHF）を活用して、AIアプリケーションに人間中心の設計を適用しています。同社は、人間によるフィードバックを含む信頼性の高いトレーニングデータセットを作成し、開発

Question

ある企業が、報酬に基づくフィードバックを用いた強化学習（RLHF）を活用して、AIアプリケーションに人間中心の設計を適用しています。同社は、人間によるフィードバックを含む信頼性の高いトレーニングデータセットを作成し、開発中の大規模言語モデル（LLM）の性能向上を図りたいと考えています。この要件を満たすソリューションはどれですか？

Accepted Answer

B. Amazon SageMaker Ground Truthを使用する

Answer

A. Amazon SageMakerの組み込みアルゴリズムを使用する

Answer

C. Amazon SageMaker Autopilotを使用する

Answer

D. Amazon SageMaker Pipelinesを使用する

Q86 — AWS AIF-C01 第3章

正解: B. Amazon SageMaker Ground Truthを使用する

解説