Q53 — AWS AIF-C01 第1章
第 53/100 题 | ← 返回第1章
某公司希望况用语言模型谢致缘设备上创建一个推按应用程序。推按必须具有尽可能低的延迟。曾种解决方案能满足这些要求?
- A. 在边缘设备上部署优化的小型语言模型 (SLM)。 ✓
- B. 在边缘设备上部署优化的大型语言模型 (LLM)。
- C. 整合集中式小语言模型 (SLM) API,以便与边缘设备进行异步通信。
- D. 整合集中式大型语言模型 (LLM) API,以便与边缘设备进行异步通信。
正确答案: A. 在边缘设备上部署优化的小型语言模型 (SLM)。
解析
这道题考察的是边缘设备上推理应用程序的优化选择。考虑到边缘设备通常资源有限,且要求低延迟,选择A提到的“在边缘设备上部署优化的小型语言模型(SLM)”是最合适的。因为小型模型相较于大型模型,计算需求更低,更适合在资源受限的边缘设备上运行,且能实现更低的延迟。而选项B的大型模型可能会因为资源消耗过大而导致延迟增加。选项C和D提到的集中式模型,由于需要与服务器进行通信,会增加延迟,不符合题目要求的低延迟条件。 查看全部