Q43 — AWS DEA-C01 第1章
第 43/100 問 | ← 第1章
ある企業は、オンプレミスのApache HadoopクラスターをAmazon EMRに移行する計画を立てています。また、データカタログを永続ストレージソリューションに移行する必要があります。 企業は現在、Hadoopクラスター上のオンプレミスのApache Hiveメタストアにデータカタログを保存しています。企業は、サーバーレスソリューションを用いてデータカタログを移行する必要があります。 これらの要件を最もコスト効率よく満たすソリューションはどれですか?
- A. AWS Database Migration Service(AWS DMS)を使用してHiveメタストアをAmazon S3に移行します。AWS Glue Data CatalogがAmazon S3をスキャンしてデータカタログを生成するように設定します。
- B. Amazon EMRにHiveメタストアを設定します。既存のオンプレミスHiveメタストアをAmazon EMRに移行します。AWS Glue Data Catalogを外部データカタログとして企業のデータカタログを保存します。 ✓
- C. Amazon EMRに外部Hiveメタストアを設定します。既存のオンプレミスHiveメタストアをAmazon EMRに移行します。企業のデータカタログを保存するためにAmazon Aurora MySQLを使用します。
- D. Amazon EMRに新しいHiveメタストアを設定します。既存のオンプレミスHiveメタストアをAmazon EMRに移行します。新しいメタストアを企業のデータカタログとして使用します。
正解: B. Amazon EMRにHiveメタストアを設定します。既存のオンプレミスHiveメタストアをAmazon EMRに移行します。AWS Glue Data Catalogを外部データカタログとして企業のデータカタログを保存します。
解説
正解はBです。まず、Amazon EMRにHiveメタストアを設定することで、既存のオンプレミスHiveメタストアをシームレスに移行できます。さらに、AWS Glue Data Catalogを外部データカタログとして使用することで、その強力な機能と柔軟性を活用でき、サーバーレス要件を満たしつつ、運用コストおよび複雑性を削減できます。一方、選択肢Aでは、AWS DMSを用いてS3へ移行し、GlueがS3をスキャンするという追加の複雑性とコストが発生します。選択肢Cでは、Amazon Aurora MySQLを使用するため追加費用が発生します。選択肢Dでは、新しいメタストアを単純に設定するだけで、既存リソースおよび外部データカタログの利点を活用していません。したがって、総合的に見て、選択肢Bが最も最適な解です。