Q11 — AWS DEA-C01 第1章
第 11/100 問 | ← 第1章
ある会社は、投資ポートフォリオの財務パフォーマンスの日々の記録を.csv形式でAmazon S3バケットに保存しています。データエンジニアはAWS Glueクローラーを使用してS3データをクロールします。 データエンジニアは、S3データをAWS Glue Data Catalogで毎日利用可能にする必要があります。
- A. AmazonS3FullAccessポリシーを含むIAMロールを作成します。このロールをクローラーに関連付けます。ソースデータのS3バケットパスをクローラーのデータストアとして指定します。クローラーを毎日実行するスケジュールを作成します。出力先を既存のS3バケット内の新しいパスに設定します。
- B. AWSGlueServiceRoleポリシーを含むIAMロールを作成します。このロールをクローラーに関連付けます。ソースデータのS3バケットパスをクローラーのデータストアとして指定します。クローラーを毎日実行するスケジュールを作成します。出力先としてデータベース名を指定します。 ✓
- C. AmazonS3FullAccessポリシーを含むIAMロールを作成します。このロールをクローラーに関連付けます。ソースデータのS3バケットパスをクローラーのデータストアとして指定します。毎日クローラーを実行するためにデータ処理ユニット(DPU)を割り当てます。出力先としてデータベース名を指定します。
- D. AWSGlueServiceRoleポリシーを含むIAMロールを作成します。このロールをクローラーに関連付けます。ソースデータのS3バケットパスをクローラーのデータストアとして指定します。毎日クローラーを実行するためにデータ処理ユニット(DPU)を割り当てます。出力先を既存のS3バケット内の新しいパスに設定します。
正解: B. AWSGlueServiceRoleポリシーを含むIAMロールを作成します。このロールをクローラーに関連付けます。ソースデータのS3バケットパスをクローラーのデータストアとして指定します。クローラーを毎日実行するスケジュールを作成します。出力先としてデータベース名を指定します。
解説
AWS Glueクローラーは、適切な権限を持つIAMロールと関連付ける必要があります。AWSGlueServiceRoleポリシーは、S3へのアクセスおよびGlue操作の実行に必要な権限を含んでいます。毎日のクローラー実行は、スケジュールの作成によって実現され、DPUの手動割り当ては不要です。データベース名を指定することで、クローラーの出力メタデータがGlue Data Catalogに正しく保存されます。AmazonS3FullAccessポリシーは過剰な権限であり、またDPUの割り当てはAWSが自動で処理します。正しい選択肢は、AWSGlueServiceRoleポリシー、スケジュール設定、およびデータベース出力を含むものです。[AWSドキュメントによると、AWSGlueServiceRoleポリシーは、S3へのアクセスおよびData Catalogの更新を含むGlueサービスに必要な権限を提供します。定期実行の設定にはScheduleを使用し、DPUの割り当ては不要です。出力先をデータベースではなくS3パスに設定するのは、Data Catalogの使用目的に反します。選択肢Bはこれらすべての要件を満たします。]