Q53 — AWS AIF-C01 第1章

第 53/100 問 | ← 第1章

ある企業が、言語モデルを用いてエッジデバイス上で推論アプリケーションを構築したいと考えています。この推論は、可能な限り低い遅延を実現する必要があります。どのソリューションがこれらの要件を満たしますか?

正解: A. エッジデバイス上に最適化された小型言語モデル(SLM)を展開する。

解説

本問は、エッジデバイス上の推論アプリケーションの最適化に関する理解を問うものです。エッジデバイスは通常リソースが限られており、かつ低遅延が求められるため、選択肢A「エッジデバイス上に最適化された小型言語モデル(SLM)を展開する」が最も適切です。小型モデルは大規模モデルと比べて計算リソース消費が少なく、リソース制約のあるエッジデバイス上で動作させやすく、さらに低遅延を実現できます。選択肢Bの大規模モデルはリソース消費が大きいため遅延が増加する可能性があります。選択肢CおよびDの集中型モデルはサーバーとの通信を必要とするため、遅延が増加し、低遅延要件を満たしません。