Q321. ある企業が、AWS上で新しい機械学習（ML）モデルソリューションを開発しています。これらのモデルは、起動時にAmazon S3から約1 GBのモデルデータを取得し、メモリに読み込む独立したマイクロサービスとし

Question

Q321. ある企業が、AWS上で新しい機械学習（ML）モデルソリューションを開発しています。これらのモデルは、起動時にAmazon S3から約1 GBのモデルデータを取得し、メモリに読み込む独立したマイクロサービスとして開発されています。ユーザーは非同期API経由でモデルにアクセスし、単一のリクエストまたはリクエストのバッチを送信して、結果の送信先を指定できます。同社は数百人のユーザーにモデルを提供しており、モデルの利用パターンは不規則です。一部のモデルは数日〜数週間使われない場合があり、一方で他のモデルは一度に数千件のリクエストのバッチを受信することもあります。これらの要件を満たすために、ソリューションアーキテクトが推奨すべき設計はどれですか？

Accepted Answer

D. APIからのリクエストをAmazon Simple Queue Service（Amazon SQS）キューに送信します。モデルをAmazon Elastic Container Service（Amazon ECS）サービスとしてデプロイし、そのサービスがキューからメッセージを読み取るようにします。SQSキューのサイズに基づいて、Amazon ECSのクラスターおよびサービスのコピー両方に対してAWS Auto Scalingを有効化します。

Answer

A. APIからのリクエストをNetwork Load Balancer（NLB）にルーティングします。モデルをAWS Lambda関数としてデプロイし、NLBによって呼び出されるようにします。

Answer

B. APIからのリクエストをApplication Load Balancer（ALB）にルーティングします。モデルをAmazon Elastic Container Service（Amazon ECS）サービスとしてデプロイし、Amazon Simple Queue Service（Amazon SQS）キューからメッセージを読み取るようにします。SQSキューのサイズに基づいて、AWS App Meshを用いてECSクラスターのインスタンス数をスケールさせます。

Answer

C. APIからのリクエストをAmazon Simple Queue Service（Amazon SQS）キューに送信します。モデルをAWS Lambda関数としてデプロイし、SQSイベントによって呼び出されるようにします。SQSキューのサイズに基づいて、AWS Auto Scalingを使用してLambda関数のvCPU数を増加させます。

Q21 — AWS SAA-C03 第5章

解説