ソーシャルメディア企業が、大規模言語モデル（LLM）をコンテンツ審査に活用したいと考えています。この企業は、LLMの出力にバイアスが存在するか、特定のグループや個人に対する潜在的な差別がないかを評価したいと考えています。

Question

ソーシャルメディア企業が、大規模言語モデル（LLM）をコンテンツ審査に活用したいと考えています。この企業は、LLMの出力にバイアスが存在するか、特定のグループや個人に対する潜在的な差別がないかを評価したいと考えています。
企業は、どのデータソースを用いてLLMの出力を評価すべきでしょうか。また、必要な管理作業量は最小限に抑えたいと考えています。

Accepted Answer

D. ベンチマークデータセット

Answer

A. ユーザー生成コンテンツ

Answer

B. 審査ログ

Answer

C. コンテンツ審査ガイドライン

Q22 — AWS AIF-C01 第2章

正解: D. ベンチマークデータセット

解説