Q49 — AWS SAP-C02 第1章
第 49/75 题 | ← 返回第1章
Q124. 一家金融服务公司定期从信用卡服务合作伙伴那里接收数据馈送。大约每 15 分钟以明文形式发送约 5,000 条记录,通过 HTTPS 直接传送到启用了服务端加密的 Amazon S3 存储桶中。此馈送包含敏感的信用卡主账号 (PAN) 数据。公司需要在将数据发送到另一个 S3 存储桶进行额外内部处理之前自动掩码 PAN。公司还需要移除和合并特定字段,然后将记录转换为 JSON 格式。此外,未来可能会添加额外的馈送,因此任何设计都需要易于扩展。哪个解决方案将满足这些要求?
- A. 在文件交付时调用 AWS Lambda 函数,提取每条记录并将其写入 Amazon SQS 队列。当 SQS 队列中有新消息时调用另一个 Lambda 函数处理记录,将结果写入 Amazon S3 的临时位置。SQS 队列为空时调用最终的 Lambda 函数将记录转换为 JSON 格式并将结果发送到另一个 S3 存储桶进行内部处理。
- B. 在文件交付时调用 AWS Lambda 函数,提取每条记录并将其写入 Amazon SQS 队列。配置 AWS Fargate 容器应用程序在 SQS 队列包含消息时自动扩展到单个实例。让应用程序处理每条记录并将记录转换为 JSON 格式。队列为空时,将结果发送到另一个 S3 存储桶进行内部处理并缩减 AWS Fargate 实例。
- C. 根据数据馈送格式创建 AWS Glue 爬网程序和自定义分类器,并构建匹配的表定义。在文件交付时调用 AWS Lambda 函数以启动 AWS Glue ETL 作业,根据处理和转换要求转换整个记录。将输出格式定义为 JSON。完成后,让 ETL 作业将结果发送到另一个 S3 存储桶进行内部处理。 ✓
- D. 根据数据馈送格式创建 AWS Glue 爬网程序和自定义分类器,并构建匹配的表定义。在文件交付时执行 Amazon Athena 查询以启动 Amazon EMR ETL 作业,根据处理和转换要求转换整个记录。将输出格式定义为 JSON。完成后,将结果发送到另一个 S3 存储桶进行内部处理并缩减 EMR 集群。
正确答案: C. 根据数据馈送格式创建 AWS Glue 爬网程序和自定义分类器,并构建匹配的表定义。在文件交付时调用 AWS Lambda 函数以启动 AWS Glue ETL 作业,根据处理和转换要求转换整个记录。将输出格式定义为 JSON。完成后,让 ETL 作业将结果发送到另一个 S3 存储桶进行内部处理。
解析
为处理信用卡数据的掩码和转换,推荐的解决方案是: C. 根据数据馈送格式创建 AWS Glue 爬网程序和自定义分类器,并构建匹配的表定义。在文件交付时调用 AWS Lambda 函数以启动 AWS Glue ETL 作业,根据处理和转换要求转换整个记录。将输出格式定义为 JSON。完成后,让 ETL 作业将结果发送到另一个 S3 存储桶进行内部处理。 说明: AWS Glue 是一个完全托管的 ETL 服务,适合数据转换任务。Glue 爬网程序和自定义分类器可以自动理解数据格式。当需要添加新馈送时,只需创建新的分类器和 ETL 作业即可轻松扩展。