Q92 — AWS DEA-C01 第1章
第 92/100 問 | ← 第1章
マーケティング企業は、クリックストリームデータをAmazon S3に保存しています。同社は、別々のバケットに格納されたS3オブジェクトに対してSQL JOIN句を用いて、毎日の終了時にデータをクエリします。 同社は、これらのオブジェクトに基づいて主要業績評価指標(KPI)を作成します。同社は、データをパーティション化してクエリできるサーバーレスソリューションを必要としています。また、データの原子性(Atomicity)、一貫性(Consistency)、独立性(Isolation)、耐久性(Durability)(ACID)特性を維持する必要があります。
- A. Amazon S3 Select
- B. Amazon Redshift Spectrum
- C. Amazon Athena ✓
- D. Amazon EMR
正解: C. Amazon Athena
解説
本問の要件は、Amazon S3に保存されたデータをクエリするサーバーレスソリューションであり、データのパーティショニングによるクエリ対応とACID特性の維持が求められます。A. Amazon S3 Selectは、S3からデータのサブセットを取得するのに使用されますが、SQL JOINや複雑なクエリ操作をサポートせず、ACID特性も保証しません。B. Amazon Redshift SpectrumはS3上のデータをクエリ可能ですが、Redshiftベースのデータウェアハウスサービスであり、完全なデータウェアハウス機能が不要な場合、コスト効率が最も良いとは限りません。C. Amazon Athenaは、S3に保存されたデータを直接クエリ可能なサーバーレスの対話型クエリサービスであり、SQL標準(JOINなど複雑なクエリ含む)をサポートし、パーティション化されたデータを処理でき、ACID特性を満たします。大規模データセット向けに設計されており、コスト効率の高い選択肢です。D. Amazon EMRはHadoopやSparkなどのビッグデータフレームワークを実行するマネージドサービスですが、クラスター管理が必要であり、サーバーレスソリューションではありません。したがって、C(Amazon Athena)が要件を最も満たし、コスト効率も最も高いソリューションです。