Q81 — AWS AIF-C01 第1章

第 81/100 题 | ← 返回第1章

一家公司利用生成式AI构建了一个解决方案。该方案采用击型语言模型(LLMS)将培训第册从英语翻译成其冲语言。公司希望通过检查为第册生成的文本来评估该解决方案的准确财。 曾种模型评估策略能满足这些要求?

正确答案: A. 双语评估替代指标(BLEU)

解析

在评估生成式AI构建的翻译解决方案的准确性时,需要一种能够衡量翻译文本与参考文本之间相似度的指标。双语评估替代指标(BLEU)是一种常用的评估机器翻译质量的指标,它通过计算候选译文与参考译文之间的n元词组匹配程度来评估翻译的准确性。均方根误差(RMSE)通常用于回归问题的评估,不适用于翻译质量的评估。面向召回的替代评估方法(ROUGE)主要用于文本摘要的评估,而不是翻译质量的评估。F1得分则常用于分类问题的评估,同样不适用于此处的翻译准确性评估。因此,选择双语评估替代指标(BLEU)作为模型评估策略,能够满足公司评估翻译解决方案准确性的要求。 查看全部