Q61 — AWS AIF-C01 第1章
第 61/100 問 | ← 第1章
あるソーシャルメディア企業が、大規模言語モデル(LLM)をコンテンツモデレーションに活用しようとしています。同社は、LLM の出力を評価し、特定のグループや個人に対する偏見および潜在的な差別が存在するかどうかを確認したいと考えています。LLM の出力を評価するには、どのデータソースを用いるべきですか?
- A. ユーザー生成コンテンツ
- B. モデレーションログ
- C. コンテンツモデレーションガイドライン
- D. ベンチマークデータセット ✓
正解: D. ベンチマークデータセット
解説
本問は、LLM 出力の評価に用いるデータソースに関する理解を問うものです。LLM 出力における偏見および潜在的な差別の有無を評価する際、ベンチマークデータセットは、客観的かつ包括的で代表的な基準を提供します。ユーザー生成コンテンツは代表性に乏しく、モデレーションログはプロセス監視に重点を置き、コンテンツモデレーションガイドラインは原則に基づくものであり、定量的評価には不向きです。一方、ベンチマークデータセットは多様な典型事例を含み、正確な評価を可能にするため、D 選択肢が正解です。