Q21 — AWS DEA-C01 第1章
第 21/100 题 | ← 返回第1章
数据工程师需要关联来自多个数据源的数据以执行一次性分析任务。这些数据分别存储在Amazon DynamoDB、Amazon RDS、Amazon Redshift和Amazon S3中。
- A. 使用Amazon EMR预置集群读取所有数据源,使用Apache Spark关联数据并执行分析。
- B. 将DynamoDB、Amazon RDS和Amazon Redshift中的数据复制到Amazon S3,然后直接在S3文件上运行Amazon Athena查询。
- C. 使用Amazon Athena联邦查询(Federated Query)关联所有数据源的数据。 ✓
- D. 使用Redshift Spectrum直接从Redshift查询DynamoDB、Amazon RDS和Amazon S3中的数据。
正确答案: C. 使用Amazon Athena联邦查询(Federated Query)关联所有数据源的数据。
解析
对于一次性分析任务,选项C(Amazon Athena联邦查询)最具成本效益:它无需预置或管理任何计算资源,按查询扫描数据量付费,且原生支持跨DynamoDB、RDS、Redshift和S3等多源联合查询,免去数据移动与复制开销。选项A需预置EMR集群,产生持续计算与管理成本;选项B涉及多次ETL复制操作,增加延迟、存储成本及失败风险;选项D中Redshift Spectrum不支持直接查询DynamoDB和RDS(仅支持S3及部分外部数据源),技术上不可行。因此,选项C是正确答案。