Q52 — AWS DEA-C01 第1章
第 52/100 题 | ← 返回第1章
一家金融公司希望使用 Amazon Athena 对 PB 级数据集运行按需 SQL 查询,以支持业务智能(BI)应用。一个 AWS Glue 作业在非营业时间每天更新一次该数据集。该 BI 应用的标准数据刷新频率为 1 小时,以符合公司政策。 一位数据工程师希望在不增加任何额外基础设施成本的情况下,优化公司对 Amazon Athena 的使用成本。 以下哪种解决方案可在满足这些要求的同时,实现最低的运营开销?
- A. 配置 Amazon S3 生命周期策略,在 1 天后将数据移至 S3 Glacier Deep Archive 存储类别。
- B. 对 SQL 查询使用 Amazon Athena 的查询结果重用功能。 ✓
- C. 在 BI 应用与 Athena 之间添加 Amazon ElastiCache 集群。
- D. 将数据集中文件的格式更改为 Apache Parquet。
正确答案: B. 对 SQL 查询使用 Amazon Athena 的查询结果重用功能。
解析
针对这个场景,我们需要找到一种既能满足业务需求又能最小化运营成本的解决方案。考虑到BI应用每小时需要刷新数据,而数据集由AWS Glue作业每天更新一次,我们需要确保在这两者之间找到一个平衡点。选项A提出将数据移动到S3 Glacier Deep Archive存储类,这并不符合需求,因为这将影响数据的即时访问性,增加查询延迟。选项B建议使用Amazon Athena的查询结果重用功能。这是一个理想的解决方案,因为它可以减少重复查询相同数据集时产生的成本,同时不会引入额外的基础设施成本或运营开销。选项C提出添加Amazon ElastiCache集群,这虽然可能提高查询性能,但会增加基础设施成本,不符合成本优化的要求。选项D建议改变数据集的文件格式,虽然这可能提高查询效率,但同样不涉及成本优化,且可能需要额外的数据处理工作。综上所述,选项B是最符合题目要求的解决方案,因为它提供了一种在不增加运营开销的情况下优化成本的方法。