ある企業は生成AIを活用してソリューションを構築しています。このソリューションでは、大規模言語モデル（LLM）を用いてトレーニングマニュアルを英語からその他の言語に翻訳します。企業は、生成されたマニュアルのテキストを検査

Question

ある企業は生成AIを活用してソリューションを構築しています。このソリューションでは、大規模言語モデル（LLM）を用いてトレーニングマニュアルを英語からその他の言語に翻訳します。企業は、生成されたマニュアルのテキストを検査することで、このソリューションの正確性を評価したいと考えています。どのモデル評価戦略がこれらの要件を満たしますか？

Accepted Answer

A. 双語評価代替指標（BLEU）

Answer

B. 二乗平均平方根誤差（RMSE）

Answer

C. 再現率指向の代替評価法（ROUGE）

Answer

D. F1スコア

Q79 — AWS AIF-C01 第1章

正解: A. 双語評価代替指標（BLEU）

解説