ある会社は、JSON形式および.csv形式のデータセットをAmazon S3バケットに保存しています。この会社は、Amazon RDS for Microsoft SQL Serverデータベース、プロビジョニング容量モ

Question

ある会社は、JSON形式および.csv形式のデータセットをAmazon S3バケットに保存しています。この会社は、Amazon RDS for Microsoft SQL Serverデータベース、プロビジョニング容量モードのAmazon DynamoDBテーブル、およびAmazon Redshiftクラスターを所有しています。データエンジニアリングチームは、データサイエンティストがSQLに類似した構文を用いてすべてのデータソースをクエリできるソリューションを開発する必要があります。

Accepted Answer

A. AWS Glueを使用してデータソースをクロールします。メタデータをAWS Glue Data Catalogに保存します。Amazon Athenaを使用してデータをクエリします。構造化データソースにはSQLを使用します。JSON形式で保存されたデータにはPartiQLを使用します。

Answer

B. AWS Glueを使用してデータソースをクロールします。メタデータをAWS Glue Data Catalogに保存します。Redshift Spectrumを使用してデータをクエリします。構造化データソースにはSQLを使用します。JSON形式で保存されたデータにはPartiQLを使用します。

Answer

C. AWS Glueを使用してデータソースをクロールします。メタデータをAWS Glue Data Catalogに保存します。AWS Glueジョブを使用してJSON形式のデータをApache Parquetまたは.csv形式に変換します。変換後のデータをS3バケットに保存します。Amazon Athenaを使用して、S3バケット内の元のデータおよび変換済みデータをクエリします。

Answer

D. AWS Lake Formationを使用してデータレイクを作成します。Lake Formationジョブを使用して、すべてのデータソースからデータをApache Parquet形式に変換します。変換後のデータをS3バケットに保存します。Amazon AthenaまたはRedshift Spectrumを使用してデータをクエリします。

Q60 — AWS DEA-C01 第1章

解説