Q9 — AWS AIF-C01 第3章
第 9/100 問 | ← 第3章
あるデータサイエンティストが、Amazon SageMakerを用いて大規模言語モデル(LLM)のテキスト生成実験を行っています。同氏は、モデルの応答に性別、年齢、人種に関するバイアスが存在するかどうかを評価したいと考えています。この要件を満たす評価タイプはどれですか?
- A. 事実知識(Fact Knowledge)
- B. プロンプトによるステレオタイプ(Prompt Stereotype) ✓
- C. 毒性(Toxicity)
- D. 意味的ロバストネス(Semantic Robustness)
正解: B. プロンプトによるステレオタイプ(Prompt Stereotype)
解説
モデルの応答に性別、年齢、人種などの属性に基づくバイアスや固定観念が含まれているかを評価するには、「プロンプトによるステレオタイプ」評価が適用されます。この評価手法は、モデルが訓練データに由来する偏見や先入観を応答に反映していないかを検出し、特定の集団に対する不公平または偏った記述を特定します。したがって、B(プロンプトによるステレオタイプ)が該当する評価タイプです。