Q47 — AWS DEA-C01 第1章
第 47/100 問 | ← 第1章
データエンジニアは、Amazon EMRおよびAmazon Athenaクエリを通じてユーザーがアクセスする中央メタデータリポジトリを維持する必要があります。このリポジトリは多数のテーブルのスキーマおよびプロパティを提供する必要があります。一部のメタデータはApache Hiveに格納されています。データエンジニアは、Hiveから中央メタデータリポジトリへメタデータをインポートする必要があります。 これらの要件を満たすソリューションのうち、最も少ない開発負荷で実現できるのはどれですか?
- A. Amazon EMRおよびApache Rangerを使用します。
- B. EMRクラスター上にHiveメタストアを使用します。
- C. AWS Glue Data Catalogを使用します。 ✓
- D. Amazon RDS for MySQL DBインスタンス上のメタストアを使用します。
正解: C. AWS Glue Data Catalogを使用します。
解説
AWS Glue Data Catalogは、Amazon EMRおよびAmazon AthenaなどAWSサービス向けに完全マネージドなメタデータストアサービスであり、Hiveとの互換性を備えています。これにより、データエンジニアは追加の開発作業なしに、既存のHiveメタストアからメタデータを容易にインポートできます。選択肢Cは、AWS Glue Data Catalogの既存機能とHive互換性を活用することで、最小限の開発負荷で要件を満たします。他の選択肢(AおよびD)は追加の設定が必要であり、Bはこのような統合に最適化されていません。