Q30 — AWS AIF-C01 第3章

第 30/100 問 | ← 第3章

ある企業が、テキスト生成向けの基礎モデル（FM）の性能を評価したいと考えています。このような要件を満たす技術または指標はどれですか？

A. 強化学習
B. F1スコア
C. ROUGE（Recall-Oriented Understudy for Gisting Evaluation） ✓
D. ファインチューニング

正解: C. ROUGE（Recall-Oriented Understudy for Gisting Evaluation）

解説

テキスト生成向けの基礎モデル（FM）の性能を評価する際には、生成されたテキストと与えられた入力との関連性を測定する必要があります。ROUGE（Recall-Oriented Understudy for Gisting Evaluation）は、生成テキストと参照テキスト間の重複および類似性を評価するための指標であり、テキスト生成モデルの性能を判断するために特化されています。したがって、C選択肢「ROUGE（Recall-Oriented Understudy for Gisting Evaluation）」がこの要件を満たす技術または指標です。