Q77 — AWS DEA-C01 第1章

第 77/100 题 | ← 返回第1章

一家零售公司将其交易、门店位置和客户信息三张表存储在由四个预留ra3.4xlarge节点组成的Amazon Redshift集群中。所有三张表均采用EVEN(均匀)分布方式。 该公司仅每隔几年更新一次门店位置表一两次。 一名数据工程师注意到,Redshift队列正在变慢,因为大多数查询都会持续将整个门店位置表广播到全部四个计算节点。该数据工程师希望最小化门店位置表的广播,以提升查询性能。 哪种解决方案能以最具成本效益的方式满足这些要求?

正确答案: A. 将门店位置表的分布方式从EVEN分布更改为ALL分布。

解析

在这个情境中,问题在于门店位置表的广播导致查询性能下降。选项A是将分布样式从EVEN更改为ALL分布。ALL分布适用于不常更新且参与连接操作较少的大表,可减少广播,成本相对较低。选项B基于最高维度的列将分布样式更改为KEY分布,可能需要重新设计表结构和数据分布,成本较高且复杂性增加。选项C添加连接列到排序键对解决广播问题效果不明显。选项D升级Redshift预留节点的实例大小成本较高,且不能直接解决表广播的问题。综上所述,选项A是最经济有效的解决方案。