あるソーシャルメディア企業が、大規模言語モデル（LLM）をコンテンツモデレーションに活用しようとしています。同社は、LLM の出力を評価し、特定のグループや個人に対する偏見および潜在的な差別が存在するかどうかを確認したい

Question

あるソーシャルメディア企業が、大規模言語モデル（LLM）をコンテンツモデレーションに活用しようとしています。同社は、LLM の出力を評価し、特定のグループや個人に対する偏見および潜在的な差別が存在するかどうかを確認したいと考えています。LLM の出力を評価するには、どのデータソースを用いるべきですか？

Accepted Answer

D. ベンチマークデータセット

Answer

A. ユーザー生成コンテンツ

Answer

B. モデレーションログ

Answer

C. コンテンツモデレーションガイドライン

Q61 — AWS AIF-C01 第1章

正解: D. ベンチマークデータセット

解説