Q24 — AWS SAA-C03 第5章
第 24/65 题 | ← 返回第5章
Q324.一家公司使用遗留应用程序生成 CSV 格式的数据.遗留应用程序将输出数据存储在 Amazon S3 中.该公司正在部署一个新的商业现成 (COTS) 应用程序,该应用程序可以执行复杂的 SQL 查询来分析仅存储在 Amazon Redshift 和 Amazon S3 中的数据.但是,COTS 应用程序无法处理遗留应用程序生成的 csv 文件.公司无法更新遗留应用程序以生成另一种格式的数据.公司需要实施一种解决方案,以便 COTS 应用程序可以使用遗留应用程序生成的数据哪种解决方案能够以最少的运营开销满足这些要求?
- A. 创建一个按计划运行的 AWS Glue 提取、转换和加载 (ETL) 作业.配置 ETL 作业以处理 .csv 文件并将处理后的数据存储在 Amazon Redshift 中 ✓
- B. 开发在 Amazon EC2 实例上运行的 Python 脚本,将 csy 文件转换为 .sql 文件.在 cron 计划上调用 Python 脚本,将输出文件存储在 Amazon S3 中
- C. 创建一个 AWS IAMbda 函数和一个 Amazon DynamoDB 表.使用 S3 事件调用 IAMbda 函数.配置 IAMbda 函数以执行提取.转换和加载 (ETL) 作业以处理 csv 文件并将处理后的数据存储在 DynamoDB 表中
- D. 使用 Amazon EventBridge 按每周计划启动 Amazon EMR 集群.配置 EMR 集群以执行提取、转换和加载 (ETL) 作业以处理 .csv 文件并将处理后的数据存储在 Amazon Redshift 表中
正确答案: A. 创建一个按计划运行的 AWS Glue 提取、转换和加载 (ETL) 作业.配置 ETL 作业以处理 .csv 文件并将处理后的数据存储在 Amazon Redshift 中
解析
AWS Glue 提供完全托管的提取、转换和加载 (ETL) 服务,该服务可以按计划运行以处理 CSV 文件并将处理后的数据存储在 Amazon Redshift 中.这种方法允许您自动执行转换过程,而无需手动转换文件或管理任何基础设施.选项 B,即开发 Python 脚本以将 CSV 文件转换为在 Amazon EC2 实例上运行的 SQL 文件,涉及管理实例、部署代码和随时间维护实例的额外运营开销.选项 C 使用 AWS Lambda 函数和 DynamoDB 表,对于大量数据可能效率不高,因为它主要是为小而简单的任务设计的.选项 D 涉及启动 EMR 集群,与 AWS Glue 相比,它可能具有额外的间接成本和维护成本.