Q69 — AWS DEA-C01 第1章

第 69/100 問 | ← 第1章

オンライン小売企業は、Application Load Balancer(ALB)のアクセスログをAmazon S3バケットに保存しています。企業は、Amazon Athenaを使用してこれらのログをクエリし、トラフィックパターンを分析したいと考えています。 データエンジニアは、Athenaで非パーティション化されたテーブルを作成しました。データ量が徐々に増加するにつれ、クエリの応答時間も長くなっています。データエンジニアは、Athenaでのクエリパフォーマンスを向上させたいと考えています。 これらの要件を満たし、かつ運用上の労力が最小となるソリューションはどれですか?

正解: B. すべてのALBアクセスログのスキーマを決定するクラスファイアを含むAWS Glueクローラーを作成し、パーティションメタデータをAWS Glue Data Catalogに書き込みます。

解説

Athenaクエリパフォーマンスを改善し、かつ運用上の労力を最小限に抑えるには、自動化度の高いソリューションを選択する必要があります。選択肢Bは、AWS Glueクローラーを提供しており、これはデータスキーマを自動的に検出し、パーティションメタデータをAWS Glue Data Catalogに書き込むことができます。これにより、Athenaはこれらのパーティション情報を活用してクエリパフォーマンスを最適化できます。一方、他の選択肢はより多くの手動設定およびコーディング作業を必要とします。選択肢AはAWS Glueジョブの作成を必要とし、選択肢CはAWS Lambda関数の作成およびデータ形式・パーティションの処理を必要とし、選択肢DはApache HiveおよびLambda関数の併用を必要とします。したがって、選択肢Bは最少の運用労力で、クエリパフォーマンスの改善という要件を満たします。