Q53 — AWS DEA-C01 第1章
第 53/100 問 | ← 第1章
ある会社のデータエンジニアは、テーブルSQLクエリのパフォーマンスを最適化する必要があります。この会社は、Amazon Redshiftクラスターにデータを保存しています。 予算制約により、クラスターのサイズを拡大することはできません。 この会社は、複数のテーブルにデータを保存し、EVEN分散スタイルを使用してデータをロードしています。一部のテーブルは数百ギガバイトのサイズであり、他のテーブルは10MB未満です。 これらの要件を満たすソリューションはどれですか?
- A. すべてのテーブルに対してEVEN分散スタイルを継続して使用します。すべてのテーブルに対して主キーおよび外部キーを指定します。
- B. 大規模なテーブルに対してALL分散スタイルを使用します。すべてのテーブルに対して主キーおよび外部キーを指定します。
- C. 更新頻度が低い小規模なテーブルに対してALL分散スタイルを使用します。すべてのテーブルに対して主キーおよび外部キーを指定します。 ✓
- D. すべてのテーブルに対して分散キー、ソートキー、パーティションキーの組み合わせを指定します。
正解: C. 更新頻度が低い小規模なテーブルに対してALL分散スタイルを使用します。すべてのテーブルに対して主キーおよび外部キーを指定します。
解説
Amazon Redshiftでは、データの分散方式がクエリパフォーマンスに大きく影響します。予算制約によりクラスターのサイズを拡大できないため、既存リソースの最適化が必要です。A:すべてのテーブルでEVEN分散スタイルを継続すると、大規模テーブルのデータが複数ノードに分散され、クエリ時のデータスキャン量が増加し、最適ではありません。B:大規模テーブルにALL分散スタイルを適用すると、データがクラスター内のすべてのノードに完全に複製されるため、ストレージ消費が非常に大きくなり、予算制約下では不適切です。C:更新頻度が低い小規模テーブルにALL分散スタイルを適用すると、データが各ノードに複製されますが、小規模テーブルの場合はストレージ消費が許容範囲内であり、クエリパフォーマンス向上に寄与します。また、すべてのテーブルの主キーおよび外部キーを指定することで、クエリ最適化が促進されます。D:すべてのテーブルに分散・ソート・パーティションキーを指定するのは、すべてのテーブルにそれらが必要とは限らず、管理の複雑性を増加させます。したがって、Cが最も適切なソリューションです。