Q53 — AWS DEA-C01 第1章

第 53/100 题 | ← 返回第1章

一家公司的数据工程师需要优化表 SQL 查询的性能。该公司在 Amazon Redshift 集群中存储数据。 由于预算限制,数据工程师无法扩大集群规模。 该公司将数据存储在多个表中,并使用 EVEN 分布样式加载数据。某些表大小达数百 GB。其他表则小于 10 MB。

正确答案: C. 对很少更新的小表使用 ALL 分布样式。为所有表指定主键和外键。

解析

在Amazon Redshift中,数据的分布方式对查询性能有重要影响。由于预算限制不能增加集群大小,数据工程师需要优化现有资源。A选项:继续使用EVEN分布风格对所有表,这可能导致大表的数据分散在多个节点上,增加查询时的数据扫描量,不是最优选择。B选项:对大表使用ALL分布风格,意味着大表的数据会完全复制到集群的每个节点上,这在大表场景下会非常消耗存储,且对于预算受限的情况并不适用。C选项:对小表(很少更新的)使用ALL分布风格,意味着小表的数据也会完全复制到每个节点,但小表的数据量小,存储消耗可接受,且能提高小表查询的性能。同时指定所有表的主键和外键可以帮助优化查询性能。D选项:指定所有表的分布、排序和分区键可能不是最优的,因为不是所有表都需要这些键来优化性能,且可能增加管理复杂性。因此,C选项是最合适的解决方案。