Q92 — AWS DEA-C01 Ch.1
Question 92 of 100 | ← Chapter 1
A marketing company uses Amazon S3 to store clickstream data. The company queries the data at the end of each day by using a SQL JOIN Clause on S3 objects that are stored in separate buckets. The company creates key performance indicators (KPIs) based on the objects. The company needs a serverless solution that will give users The ability to query data by partitioning the data. The solution must maintain the atomicity, consistency, isolation, and durability (ACID) Properties of the data. Which solution will meet these requirements MOST cost-effectively?
- A. Amazon S3 Select
- B. Amazon Redshift Spectrum
- C. Amazon Athena ✓
- D. Amazon EMR
Correct Answer: C. Amazon Athena
Explanation
针对题目需求,公司需要一个无服务器的解决方案来查询存储在AmazonS3中的数据,并且要求支持数据分区查询,同时保持数据的ACID属性。A.AmazonS3Select主要用于从S3中检索数据子集,但不支持SQLJOIN或复杂的查询操作,也不保证ACID属性。B.AmazonRedshiftSpectrum能够查询存储在S3中的数据,但它是基于Redshift的数据仓库服务,可能不是最经济的选择,特别是在不需要完整数据仓库功能时。C.AmazonAthena是一个无服务器的交互式查询服务,可以直接查询存储在AmazonS3中的数据,支持SQL标准,包括JOIN等复杂查询,同时能够处理分区数据,且满足ACID属性。它专为大规模数据集设计,是成本效益高的选择。D.AmazonEMR是一个用于运行大数据框架(如Hadoop、Spark)的托管服务,虽然可以处理复杂查询,但需要管理集群,不是无服务器解决方案。因此,C选项AmazonAthena是最符合题目要求且成本效益最高的解决方案。