Q91 — AWS DEA-C01 第1章
第 91/100 题 | ← 返回第1章
一家零售公司将其产品生命周期管理(PLM)应用的数据存储在本地MySQL数据库中。PLM应用在发生事务时频繁更新该数据库。 该公司希望近实时获取PLM应用的数据洞察,并将这些洞察与其他业务数据集集成,然后使用Amazon Redshift数据仓库分析整合后的数据集。 该公司已在本地基础设施与AWS之间建立了AWS Direct Connect连接。 哪种方案能以最少的开发工作量满足这些需求?
- A. 运行一个定时的AWS Glue提取、转换和加载(ETL)作业,通过Java数据库连接(JDBC)连接获取MySQL数据库更新,并将Amazon Redshift设为ETL作业的目标。
- B. 在AWS Database Migration Service(AWS DMS)中运行全量加载加变更数据捕获(CDC)任务,持续复制MySQL数据库变更,并将Amazon Redshift设为该任务的目标。 ✓
- C. 使用Amazon AppFlow SDK构建针对MySQL数据库的自定义连接器,以持续复制数据库变更,并将Amazon Redshift设为该连接器的目标。
- D. 运行定时的AWS DataSync任务以同步MySQL数据库中的数据,并将Amazon Redshift设为任务的目标。
正确答案: B. 在AWS Database Migration Service(AWS DMS)中运行全量加载加变更数据捕获(CDC)任务,持续复制MySQL数据库变更,并将Amazon Redshift设为该任务的目标。
解析
选项B正确:AWS DMS的全量加载加CDC任务可实现MySQL到Amazon Redshift的持续、近实时数据复制,且无需编写自定义代码,开发工作量最小。选项A的定时Glue ETL无法满足近实时性;选项C需大量SDK开发;选项D的DataSync不支持数据库变更捕获,仅适用于文件/对象存储同步。