ある企業が、言語モデルを用いてエッジデバイス上で推論アプリケーションを構築したいと考えています。この推論は、可能な限り低い遅延を実現する必要があります。どのソリューションがこれらの要件を満たしますか？

Question

Accepted Answer

A. エッジデバイス上に最適化された小型言語モデル（SLM）を展開する。

Answer

B. エッジデバイス上に最適化された大規模言語モデル（LLM）を展開する。

Answer

C. エッジデバイスと非同期通信を行うための集中型小型言語モデル（SLM）APIを統合する。

Answer

D. エッジデバイスと非同期通信を行うための集中型大規模言語モデル（LLM）APIを統合する。

Q53 — AWS AIF-C01 第1章