一名数据工程师需将结构化CSV格式的源数据摄取至Amazon S3数据湖。CSV文件包含15列。数据分析师需对数据集的一列或两列运行Amazon Athena查询，极少查询整个文件。

Question

Accepted Answer

D. 创建一个AWS Glue提取、转换和加载（ETL）作业，从CSV结构化数据源读取数据。配置该作业以Apache Parquet格式将数据写入数据湖。

Answer

A. 使用AWS Glue PySpark作业将源数据以CSV格式摄取至数据湖。

Answer

B. 创建一个AWS Glue提取、转换和加载（ETL）作业，从CSV结构化数据源读取数据。配置该作业以JSON格式将数据摄取至数据湖。

Answer

C. 使用AWS Glue PySpark作业将源数据以Apache Avro格式摄取至数据湖。

Q32 — AWS DEA-C01 第1章