Q17 — AWS DEA-C01 第1章

第 17/100 题 | ← 返回第1章

数据工程师必须使用AWS服务将数据集摄取到Amazon S3数据湖中。该数据工程师对数据集进行剖析后发现,该数据集中包含个人身份信息(PII)。该数据工程师必须实施一种解决方案,以剖析数据集并模糊化PII。 哪种解决方案能以最少的运维工作量满足此要求?

正确答案: B. 在AWS Glue Studio中使用Detect PII转换来识别PII。模糊化PII。使用AWS Step Functions状态机编排数据管道,将数据摄取到S3数据湖中。

解析

选项B是最优解,因为AWS Glue Studio中的Detect PII转换可便捷地识别个人身份信息(PII),并直接对其进行模糊化处理;同时,利用AWS Step Functions状态机协调数据管道,将处理后的数据摄取至S3数据湖,整体流程操作简便、运维工作量最小。相比之下,选项A需额外开发Lambda转换函数并调用AWS SDK实现模糊化,复杂度更高;选项C引入AWS Glue Data Quality规则进行模糊化,增加了配置与管理开销;选项D需先将数据写入DynamoDB再经Lambda处理并写入S3,步骤冗余、延迟更高。因此,选项B是正确答案。