ある企業が、言語モデルを活用してエッジデバイス上で推論を行うアプリケーションを開発したいと考えています。この推論は可能な限り低いレイテンシを実現する必要があります。どのソリューションがこれらの要件を満たしますか？

Question

Accepted Answer

A. エッジデバイス上に最適化された小型言語モデル（SLM）を展開する。

Answer

B. エッジデバイス上に最適化された大規模言語モデル（LLM）を展開する。

Answer

C. エッジデバイスと非同期通信を行うための集中型小型言語モデル（SLM）APIを統合する。

Answer

D. エッジデバイスと非同期通信を行うための集中型大規模言語モデル（LLM）APIを統合する。

Q82 — AWS AIF-C01 第1章