ある企業が、生成AIを活用してソリューションを構築しました。このソリューションでは、大規模言語モデル（LLM）を用いてトレーニングマニュアルを英語からその他の言語へ翻訳します。同社は、生成されたマニュアルのテキストを検証

Question

ある企業が、生成AIを活用してソリューションを構築しました。このソリューションでは、大規模言語モデル（LLM）を用いてトレーニングマニュアルを英語からその他の言語へ翻訳します。同社は、生成されたマニュアルのテキストを検証することで、ソリューションの正確性を評価したいと考えています。このような要件を満たすモデル評価戦略はどれですか？

Accepted Answer

A. バイリンガル評価研究（BLEU）

Answer

B. 二乗平均平方根誤差（RMSE）

Answer

C. 再現率重視のGisting評価研究（ROUGE）

Answer

D. F1スコア

Q68 — AWS AIF-C01 第1章

正解: A. バイリンガル評価研究（BLEU）

解説