Q45 — AWS DEA-C01 第1章
第 45/100 問 | ← 第1章
セキュリティ企業は、JSON形式のIoTデータをAmazon S3バケットに保存しています。データ構造は、IoTデバイスのアップグレード時に変更される可能性があります。企業は、IoTデータを含むデータカタログを作成したいと考えています。企業の分析部門は、このデータカタログを使用してデータをインデックス化します。 これらの要件を最もコスト効率よく満たすソリューションはどれですか?
- A. AWS Glue Data Catalogを作成します。AWS Glue Schema Registryを設定します。分析部門が使用するデータをAmazon Redshift Serverlessに取り込むための新しいAWS Glueワークロードを作成します。 ✓
- B. Amazon Redshiftプロビジョニングクラスターを作成します。分析部門がAmazon S3内のデータを探索できるように、Amazon Redshift Spectrumデータベースを作成します。Amazon RedshiftにデータをロードするためのRedshiftストアドプロシージャを作成します。
- C. Amazon Athenaワークグループを作成します。Apache Sparkを介してAthenaを使用してAmazon S3内のデータを探索します。Athenaワークグループのスキーマおよびテーブルを分析部門に提供します。
- D. AWS Glue Data Catalogを作成します。AWS Glue Schema Registryを設定します。Amazon Redshift Data APIを使用したAWS Lambdaユーザ定義関数(UDF)を作成します。分析部門が使用するデータをAmazon Redshift Serverlessに取り込むためのAWS Step Functionsジョブを作成します。
正解: A. AWS Glue Data Catalogを作成します。AWS Glue Schema Registryを設定します。分析部門が使用するデータをAmazon Redshift Serverlessに取り込むための新しいAWS Glueワークロードを作成します。
解説
コスト効率および問題文の要件を総合的に考慮すると、選択肢Aは包括的なソリューションを提供します。まず、AWS Glue Data Catalogを作成することで、Amazon S3に保存されたデータの管理およびインデックス化が可能になり、分析部門にとって非常に有用です。AWS Glue Schema Registryを設定することで、IoTデバイスのアップグレード時に発生するデータ構造の変更を効果的に管理できます。最後に、新しいAWS Glueワークロードを作成してデータをAmazon Redshift Serverlessに取り込むことで、分析部門がデータを効率的にアクセスおよび利用できるようになります。このソリューションは、データ管理およびインデックス化の要件を満たすだけでなく、サーバーレスのデータウェアハウスソリューションを活用することでコスト効率も考慮されています。