Q48 — AWS DEA-C01 第1章
第 48/100 题 | ← 返回第1章
一家公司需要在AWS中构建数据湖。该公司必须向特定团队提供行级数据访问和列级数据访问。这些团队将通过Amazon Athena、Amazon Redshift Spectrum以及来自Amazon EMR的Apache Hive访问数据。哪种解决方案能以最少的运维开销满足这些要求?
- A. 使用Amazon S3作为数据湖存储。使用S3访问策略按行和列限制数据访问。通过Amazon S3提供数据访问。
- B. 使用Amazon S3作为数据湖存储。通过Amazon EMR使用Apache Ranger按行和列限制数据访问。使用Apache Pig提供数据访问。
- C. 使用Amazon Redshift作为数据湖存储。使用Redshift安全策略按行和列限制数据访问。使用Apache Spark和Amazon Athena联合查询提供数据访问。
- D. 使用Amazon S3作为数据湖存储。使用AWS Lake Formation按行和列限制数据访问。通过AWS Lake Formation提供数据访问。 ✓
正确答案: D. 使用Amazon S3作为数据湖存储。使用AWS Lake Formation按行和列限制数据访问。通过AWS Lake Formation提供数据访问。
解析
AWS Lake Formation提供了统一的方式来管理数据湖的权限,支持行级和列级访问控制,并集成Amazon Athena、Redshift Spectrum和EMR。S3访问策略无法直接实现行列级别的细粒度控制(A)。Apache Ranger需要额外配置且主要适用于EMR环境(B)。Redshift不适合作为数据湖存储,且其安全策略不适用于外部服务查询(C)。Lake Formation通过集中权限管理简化了跨多个查询服务的访问控制,降低了维护复杂性。AWS官方文档指出Lake Formation能直接在数据湖中定义细粒度的访问策略,无需为每个服务单独配置。