Q89 — AWS DEA-C01 第1章
第 89/100 题 | ← 返回第1章
一名数据工程师需要调试一个从Amazon S3读取数据并写入Amazon Redshift的AWS Glue作业。该数据工程师已为该AWS Glue作业启用了书签(bookmark)功能。 该数据工程师已将AWS Glue作业的最大并发数设置为1。 该AWS Glue作业已成功将输出写入Amazon Redshift。然而,之前运行中已加载的Amazon S3文件在后续运行中被重复处理。 AWS Glue作业重复处理文件的可能原因是什么?
- A. 该AWS Glue作业缺少书签正常工作所必需的s3:GetObjectAcl权限。
- B. 该AWS Glue作业的最大并发数设置为1。
- C. 该数据工程师为Glue作业错误指定了较旧版本的AWS Glue。
- D. 该AWS Glue作业缺少必需的提交(commit)语句 ✓
正确答案: D. 该AWS Glue作业缺少必需的提交(commit)语句
解析
在AWS Glue中,书签功能用于确保作业仅处理新数据或变更的数据。若AWS Glue作业在启用书签时未执行必需的提交操作,则无法正确记录其处理进度,导致后续运行重复处理此前已加载的S3文件。因此,选项D正确,指出作业缺少必需的提交语句,这是导致文件重复处理的根本原因。