一家在线零售公司将其应用负载均衡器（ALB）访问日志存储在Amazon S3存储桶中。该公司希望使用Amazon Athena查询日志以分析流量模式。

一名数据工程师在Athena中创建了一个未分区表。随着数据量逐渐增

Question

一家在线零售公司将其应用负载均衡器（ALB）访问日志存储在Amazon S3存储桶中。该公司希望使用Amazon Athena查询日志以分析流量模式。

一名数据工程师在Athena中创建了一个未分区表。随着数据量逐渐增加，查询响应时间也随之延长。该数据工程师希望提升Athena中的查询性能。

哪种解决方案可在运营工作量最少的前提下满足这些要求？

Accepted Answer

B. 创建一个AWS Glue爬网程序，配置分类器以自动推断所有ALB访问日志的模式，并将分区元数据写入AWS Glue Data Catalog。

Answer

A. 创建一个AWS Glue作业，自动推断所有ALB访问日志的模式，并将分区元数据写入AWS Glue Data Catalog。

Answer

C. 创建一个AWS Lambda函数转换所有ALB访问日志，将结果以Apache Parquet格式保存至Amazon S3，并对元数据进行分区，然后使用Athena查询转换后的数据。

Answer

D. 使用Apache Hive创建分桶表，并使用AWS Lambda函数转换所有ALB访问日志。

Q69 — AWS DEA-C01 第1章