Q324. ある企業では、従来のアプリケーションを使用してCSV形式でデータを生成しています。この従来のアプリケーションは、出力データをAmazon S3に保存します。同社は、Amazon RedshiftおよびAmaz

Question

Q324. ある企業では、従来のアプリケーションを使用してCSV形式でデータを生成しています。この従来のアプリケーションは、出力データをAmazon S3に保存します。同社は、Amazon RedshiftおよびAmazon S3に格納されたデータに対して複雑なSQLクエリを実行して分析できる新しい商用オフ・ザ・シェルフ（COTS）アプリケーションを導入しようとしています。ただし、このCOTSアプリケーションは、従来のアプリケーションが生成するCSVファイルを処理できません。また、企業は従来のアプリケーションを更新して他の形式でデータを出力させることはできません。企業は、COTSアプリケーションが従来のアプリケーションが生成したデータを利用できるようにするソリューションを実装する必要があります。これらの要件を満たす中で、運用上のオーバーヘッドが最も少ないソリューションはどれですか？

Accepted Answer

A. スケジュール実行されるAWS Glueの抽出・変換・ロード（ETL）ジョブを作成します。このETLジョブを設定してCSVファイルを処理し、処理済みデータをAmazon Redshiftに保存します。

Answer

B. Amazon EC2インスタンス上で実行されるPythonスクリプトを開発し、CSVファイルをSQLファイルに変換します。cronスケジュールでこのPythonスクリプトを呼び出し、出力ファイルをAmazon S3に保存します。

Answer

C. AWS Lambda関数とAmazon DynamoDBテーブルを作成します。S3イベントを使用してLambda関数を起動し、そのLambda関数で抽出・変換・ロード（ETL）処理を実行してCSVファイルを処理し、処理済みデータをDynamoDBテーブルに保存するよう設定します。

Answer

D. Amazon EventBridgeを使用して週1回のスケジュールでAmazon EMRクラスターを起動します。このEMRクラスターを設定してCSVファイルを処理する抽出・変換・ロード（ETL）ジョブを実行し、処理済みデータをAmazon Redshiftテーブルに保存します。

Q24 — AWS SAA-C03 第5章

正解: A. スケジュール実行されるAWS Glueの抽出・変換・ロード（ETL）ジョブを作成します。このETLジョブを設定してCSVファイルを処理し、処理済みデータをAmazon Redshiftに保存します。

解説