Q21 — AWS DEA-C01 第1章
第 21/100 問 | ← 第1章
データエンジニアは、一度限りの分析ジョブのために複数のソースからデータを結合する必要があります。データはAmazon DynamoDB、Amazon RDS、Amazon Redshift、およびAmazon S3に格納されています。
- A. Amazon EMRプロビジョニングクラスターを使用してすべてのソースからデータを読み込み、Apache Sparkを用いてデータを結合して分析を行います。
- B. DynamoDB、Amazon RDS、Amazon RedshiftのデータをAmazon S3にコピーします。Amazon AthenaクエリをS3ファイルに対して直接実行します。
- C. Amazon Athenaフェデレーテッドクエリを使用して、すべてのデータソースからデータを結合します。 ✓
- D. Redshift Spectrumを使用して、DynamoDB、Amazon RDS、Amazon S3のデータをRedshiftから直接クエリします。
正解: C. Amazon Athenaフェデレーテッドクエリを使用して、すべてのデータソースからデータを結合します。
解説
Amazon DynamoDB、Amazon RDS、Amazon Redshift、Amazon S3など複数のデータソースからデータを一度限りの分析ジョブで結合するニーズに対して、選択肢Cが最もコスト効率が良いです。選択肢AではAmazon EMRプロビジョニングクラスターの利用によりコストが高くなります。選択肢Bではデータのコピー操作が追加され、複雑さと潜在的なコストが増加します。選択肢DのRedshift Spectrumは、このような一回限りのタスクにおいて最適とは言えません。一方、Amazon Athenaフェデレーテッドクエリは、複数のデータソースに直接接続してクエリおよび分析を行うことができ、一回限りの分析タスクに対して相対的にコストが低く、簡便です。したがって、正解はCです。