Q49 — AWS SAP-C02 第1章

第 49/75 問 | ← 第1章

Q124. 金融サービス企業は、クレジットカード取扱パートナーから定期的にデータフィードを受信しています。約5,000件のレコードが15分ごとに平文で送信され、HTTPS経由でサーバー側暗号化(SSE)が有効なAmazon S3バケットに直接配信されます。このフィードには、機密性の高いクレジットカードのプライマリアカウント番号(PAN)データが含まれています。 企業は、データを別のS3バケットに送信して内部処理を実行する前に、自動的にPANをマスクする必要があります。また、特定のフィールドを削除・統合し、レコードをJSON形式に変換する必要があります。さらに、今後追加のフィードが導入される可能性があるため、設計は容易に拡張可能である必要があります。 これらの要件を満たすソリューションはどれですか?

正解: C. データフィードのフォーマットに基づいてAWS Glueクローラーとカスタムクラスファイアを作成し、それに合致するテーブル定義を構築します。ファイル配信時にAWS Lambda関数を起動し、AWS Glue ETLジョブを開始して、すべてのレコードを処理および変換要件に従って変換します。出力形式をJSONとして定義します。処理完了後、ETLジョブが結果を内部処理用の別のS3バケットに送信します。

解説

AWS Glueクローラーを使用して、AWS Glue Data Catalogにテーブル情報を自動登録できます。Lambda関数は、S3イベント通知(オブジェクト作成イベント)によってトリガーできます。その後、Lambda関数からAWS Glue ETLジョブを起動し、機密データ(PAN)のマスキングやJSON形式への出力変換など、指定された処理・変換要件を満たすようにレコードを変換します。このソリューションは、すべての要件を満たします。