某公司通过况用生成式获工鸟能构建了一个解决方案。该解决方案况用击型语言模型（LLM）将培训第册从英语翻译成其冲语言。该公司希望通过检查为第册生成的文本来评估解决方案的准确财。曾种模型评估策略能满足这些要求？

Question

Accepted Answer

A. 双语评估研究 (BLEU)

Answer

B. 均方根误差 (RMSE)

Answer

C. 以召回为导向的 Gisting 评估研究（ROUGE）

Answer

D. F1 分数

Q68 — AWS AIF-C01 第1章