Q30 — AWS DEA-C01 第1章
第 30/100 問 | ← 第1章
ある企業は、Microsoft SQL Serverを実行するAmazon EC2インスタンスからAmazon RDS for Microsoft SQL Server DBインスタンスへデータベースサーバーを移行しています。移行が完了するまでの間、分析チームは毎日大規模なデータ要素をエクスポートする必要があります。これらのデータ要素は、複数のテーブルにまたがるSQL結合の結果です。データはApache Parquet形式でなければならず、分析チームはデータをAmazon S3に保存する必要があります。
- A. EC2インスタンス上のSQL Serverデータベースに必要なデータ要素を含むビューを作成します。AWS Glueジョブを作成し、ビューから直接データを選択してParquet形式でS3バケットに転送します。AWS Glueジョブを毎日実行するようスケジュールします。
- B. SQL Server Agentをスケジュールして、EC2インスタンス上のSQL Serverデータベースから必要なデータ要素を選択する日次SQLクエリを実行します。クエリの出力を.csvオブジェクトとしてS3バケットに直接出力するよう設定します。S3イベントを作成し、出力形式を.csvからParquetに変換するAWS Lambda関数を起動します。
- C. EC2インスタンス上のSQL Serverデータベースに必要なデータ要素を含むビューを作成するSQLクエリを使用します。AWS Glueクローラーを作成・実行してビューを読み込みます。AWS Glueジョブを作成し、データを取得してParquet形式でS3バケットに転送します。AWS Glueジョブを毎日実行するようスケジュールします。 ✓
- D. Java Database Connectivity(JDBC)を用いてEC2インスタンス上のデータベースをクエリするAWS Lambda関数を作成します。Lambda関数を設定して、必要なデータを取得し、Parquet形式に変換してS3バケットに転送します。Amazon EventBridgeを用いてLambda関数を毎日実行するようスケジュールします。
正解: C. EC2インスタンス上のSQL Serverデータベースに必要なデータ要素を含むビューを作成するSQLクエリを使用します。AWS Glueクローラーを作成・実行してビューを読み込みます。AWS Glueジョブを作成し、データを取得してParquet形式でS3バケットに転送します。AWS Glueジョブを毎日実行するようスケジュールします。
解説
要件を最も効率的に満たすためには、EC2インスタンス上のSQL Serverデータベースから直接データを選択し、Parquet形式に変換してS3に保存するソリューションが必要です。選択肢Cはこれを満たします:- EC2インスタンス上のSQL Serverデータベースに必要なデータ要素を含むビューを作成します。- AWS Glueクローラーを用いてこのビューを読み込み、Glue Data Catalogにメタデータを登録します。- AWS Glueジョブを作成し、データを取得してParquet形式でS3バケットに転送します。- AWS Glueジョブを毎日実行するようスケジュールします。この方法は、CSVへのエクスポートとその後のフォーマット変換といった中間ステップを排除し、AWS Glueによる直接的なデータ変換および保存を活用することで、全体の運用効率を向上させます。したがって、選択肢Cが最も適したソリューションです。