Q52 — AWS DEA-C01 第1章

第 52/100 問 | ← 第1章

金融会社は、ビジネスインテリジェンス(BI)アプリケーションをサポートするために、ペタバイト規模のデータセットに対してオンデマンドSQLクエリを実行するためにAmazon Athenaを使用したいと考えています。非営業時間帯に実行されるAWS Glueジョブが、毎日1回データセットを更新します。BIアプリケーションは、会社の方針に従って標準的なデータ更新頻度として1時間ごととなっています。 データエンジニアは、追加のインフラコストを発生させずに、Amazon Athenaの使用コストを最適化したいと考えています。 これらの要件を満たすソリューションのうち、最も少ない運用オーバーヘッドで実現できるのはどれですか?

正解: B. Amazon Athenaのクエリ結果再利用機能をSQLクエリに適用します。

解説

このシナリオでは、業務要件を満たしつつ運用コストを最小化するソリューションを見つける必要があります。BIアプリケーションは1時間ごとにデータを更新する必要があり、一方でデータセットはAWS Glueジョブによって毎日1回更新されます。この両者のバランスを取る必要があります。選択肢Aは、データをS3 Glacier Deep Archiveに移動することを提案していますが、これは即時アクセス性を損ない、クエリ遅延を増加させるため、要件に適合しません。選択肢Bは、Amazon Athenaのクエリ結果再利用機能を活用することを提案しています。これは、同一データセットに対する繰り返しクエリのコストを削減する理想的なソリューションであり、追加のインフラコストや運用オーバーヘッドを発生させません。選択肢Cは、Amazon ElastiCacheクラスターの追加を提案していますが、これはクエリパフォーマンス向上には寄与しても、インフラコストを増加させ、コスト最適化の要件に反します。選択肢Dは、ファイル形式をApache Parquetに変更することを提案していますが、これはクエリ効率を向上させる可能性はありますが、コスト最適化には直接関係せず、追加のデータ処理作業が必要です。以上より、選択肢Bが、運用オーバーヘッドを増加させずにコストを最適化する最も適切なソリューションです。