Q47 — AWS DEA-C01 第1章

第 47/100 题 | ← 返回第1章

一名数据工程师需要维护一个中央元数据存储库,用户可通过Amazon EMR和Amazon Athena查询访问该存储库。该存储库需提供大量表的模式和属性。部分元数据存储在Apache Hive中。该数据工程师需要将Hive中的元数据导入中央元数据存储库。哪种解决方案能以最少的开发工作量满足这些要求?

正确答案: C. 使用AWS Glue Data Catalog。

解析

AWS Glue Data Catalog是一个完全托管的元数据存储服务,专为AWS服务设计,如Amazon EMR和Amazon Athena。它可以直接与Hive兼容,允许数据工程师轻松地从Hive元存储中导入元数据到AWS Glue Data Catalog,而无需额外的开发工作。选项C通过利用AWS Glue Data Catalog的现有功能和与Hive的兼容性,提供了最少开发工作的解决方案。其他选项要么需要额外的设置(如A和D),要么不是为这种集成而优化的(如B)。