一名数据工程师有一项一次性任务：读取 Amazon S3 存储桶中 Apache Parquet 格式对象的数据，且仅需查询其中一列。

Question

Accepted Answer

B. 使用 S3 Select 编写 SQL SELECT 语句，直接从 S3 对象中检索所需列。

Answer

A. 配置一个 AWS Lambda 函数，从 S3 存储桶加载数据到 pandas DataFrame，再在该 DataFrame 上编写 SQL SELECT 语句查询所需列。

Answer

C. 准备一个 AWS Glue DataBrew 项目来消费 S3 对象并查询所需列。

Answer

D. 对 S3 对象运行 AWS Glue 爬网程序，然后在 Amazon Athena 中使用 SQL SELECT 语句查询所需列。

Q38 — AWS DEA-C01 第1章