Q63 — AWS DEA-C01 第1章

第 63/100 题 | ← 返回第1章

一家公司拥有多个应用程序,这些应用程序使用存储在 Amazon S3 存储桶中的数据集。该公司有一个电子商务应用程序,生成的数据集包含个人身份信息(PII)。该公司还有一个内部分析应用程序,不需要访问 PII。 为符合监管要求,该公司不得不必要地共享 PII。一名数据工程师需要实施一种解决方案,以便根据每个访问该数据集的应用程序的需求动态编辑(redact)PII。

正确答案: B. 创建一个 S3 Object Lambda 终端节点。使用 S3 Object Lambda 终端节点从 S3 存储桶读取数据。在 S3 Object Lambda 函数中实现编辑逻辑,以根据每个访问数据的应用程序的需求动态编辑 PII。

解析

为了遵守规定并确保不共享个人身份信息(PII),公司需要一个解决方案,该方案能够根据访问数据集的应用程序的需求动态地编辑PII。考虑到操作开销最小化的要求,我们可以逐一分析每个选项:A选项提出创建多个数据集副本,每个副本具有不同级别的编辑,以适应不同应用程序的需求。这种方法涉及数据复制和存储开销,操作复杂度高。B选项建议使用S3 Object Lambda。这种方法允许在读取数据时动态地应用编辑逻辑,而无需创建数据集的多个副本。这样减少了存储需求,并且可以根据每个应用程序的需求实时编辑数据,操作开销最小。C选项类似于A选项,使用AWS Glue进行数据转换并创建多个数据集副本,这同样涉及较高的操作开销。D选项提出使用API Gateway,并通过REST API调用动态编辑PII。虽然这种方法提供了一定的灵活性,但它增加了额外的网络调用开销和API管理复杂性。因此,考虑到操作开销最小化的要求,B选项(使用S3 Object Lambda)是最合适的解决方案。