Q9 — AWS DEA-C01 第1章

第 9/100 题 | ← 返回第1章

一名数据工程师希望加快Amazon Athena查询的执行速度。该工程师注意到,所有Athena查询所使用的数据文件当前均以未压缩的.csv格式存储。此外,该工程师还注意到,用户执行查询时大多仅选择特定列。

正确答案: C. 将数据格式从.csv更改为Apache Parquet,并应用Snappy压缩。

解析

答案C是正确的。在这种情况下,将数据格式从.csv转换为Apache Parquet格式,并应用Snappy压缩,能显著提高Athena查询性能。Parquet是一种高效的列式存储格式,对于按列查询有优势,能够减少读取的数据量。而Snappy压缩在保证较好压缩率的同时,解压速度快,适合查询时快速处理。A选项的JSON格式通常不如Parquet格式适合查询优化。B选项仅对.csv文件压缩效果不如改变格式显著。D选项gzip压缩解压速度相对较慢。综上,选项C是最优解。