Q68 — AWS AIF-C01 第1章
第 68/100 题 | ← 返回第1章
某公司通过况用生成式获工鸟能构建了一个解决方案。该解决方案况用击型语言模型(LLM)将培训第册从英语翻译成其冲语言。该公司希望通过检查为第册生成的文本来评估解决方案的准确财。曾种模型评估策略能满足这些要求?
- A. 双语评估研究 (BLEU) ✓
- B. 均方根误差 (RMSE)
- C. 以召回为导向的 Gisting 评估研究(ROUGE)
- D. F1 分数
正确答案: A. 双语评估研究 (BLEU)
解析
这道题考查模型评估策略的应用。在自然语言处理中,BLEU常用于评估机器翻译的质量,适合评估从英语翻译为其他语言的文本准确性。RMSE多用于连续数值的误差评估。ROUGE主要用于摘要生成的评估。F1分数常用于分类问题。所以对于翻译文本准确性的评估,A选项双语评估研究(BLEU)更合适。 查看全部