Q22 — AWS AIF-C01 第2章
第 22/100 問 | ← 第2章
ソーシャルメディア企業が、大規模言語モデル(LLM)をコンテンツ審査に活用したいと考えています。この企業は、LLMの出力にバイアスが存在するか、特定のグループや個人に対する潜在的な差別がないかを評価したいと考えています。 企業は、どのデータソースを用いてLLMの出力を評価すべきでしょうか。また、必要な管理作業量は最小限に抑えたいと考えています。
- A. ユーザー生成コンテンツ
- B. 審査ログ
- C. コンテンツ審査ガイドライン
- D. ベンチマークデータセット ✓
正解: D. ベンチマークデータセット
解説
本問は、LLM出力の評価に使用されるデータソースに関する知識を問うものです。LLM出力におけるバイアスおよび差別の有無を評価する際には、ベンチマークデータセットがさまざまな標準および規範に基づくサンプルを含んでおり、より体系的かつ包括的に評価できるため、管理作業量も比較的少なく済みます。一方、ユーザー生成コンテンツは雑多であり、審査ログは標準化されておらず、コンテンツ審査ガイドラインは直接的なデータソースではありません。したがって、ベンチマークデータセットを選択します。