Q53 — AWS AIF-C01 第1章
第 53/100 問 | ← 第1章
ある企業が、言語モデルを用いてエッジデバイス上で推論アプリケーションを構築したいと考えています。この推論は、可能な限り低い遅延を実現する必要があります。どのソリューションがこれらの要件を満たしますか?
- A. エッジデバイス上に最適化された小型言語モデル(SLM)を展開する。 ✓
- B. エッジデバイス上に最適化された大規模言語モデル(LLM)を展開する。
- C. エッジデバイスと非同期通信を行うための集中型小型言語モデル(SLM)APIを統合する。
- D. エッジデバイスと非同期通信を行うための集中型大規模言語モデル(LLM)APIを統合する。
正解: A. エッジデバイス上に最適化された小型言語モデル(SLM)を展開する。
解説
本問は、エッジデバイス上の推論アプリケーションの最適化に関する理解を問うものです。エッジデバイスは通常リソースが限られており、かつ低遅延が求められるため、選択肢A「エッジデバイス上に最適化された小型言語モデル(SLM)を展開する」が最も適切です。小型モデルは大規模モデルと比べて計算リソース消費が少なく、リソース制約のあるエッジデバイス上で動作させやすく、さらに低遅延を実現できます。選択肢Bの大規模モデルはリソース消費が大きいため遅延が増加する可能性があります。選択肢CおよびDの集中型モデルはサーバーとの通信を必要とするため、遅延が増加し、低遅延要件を満たしません。