Q89 — AWS DEA-C01 第1章

第 89/100 题 | ← 返回第1章

一名数据工程师需要调试一个从Amazon S3读取数据并写入Amazon Redshift的AWS Glue作业。该数据工程师已为该AWS Glue作业启用了书签(bookmark)功能。 该数据工程师已将AWS Glue作业的最大并发数设置为1。 该AWS Glue作业已成功将输出写入Amazon Redshift。然而,之前运行中已加载的Amazon S3文件在后续运行中被重复处理。 AWS Glue作业重复处理文件的可能原因是什么?

正确答案: D. 该AWS Glue作业缺少必需的提交(commit)语句

解析

在AWS Glue中,书签功能用于确保作业仅处理新数据或变更的数据。若AWS Glue作业在启用书签时未执行必需的提交操作,则无法正确记录其处理进度,导致后续运行重复处理此前已加载的S3文件。因此,选项D正确,指出作业缺少必需的提交语句,这是导致文件重复处理的根本原因。