Q63 — AWS DEA-C01 第1章
第 63/100 問 | ← 第1章
ある企業は、Amazon S3バケットに格納されたデータセットを複数のアプリケーションで使用しています。企業には、個人を特定可能な情報(PII)を含むデータセットを生成するECサイトアプリケーションがあります。また、内部アナリティクスアプリケーションがあり、これはPIIへのアクセスを必要としません。 規制遵守のため、企業はPIIを不必要に共有してはなりません。データエンジニアは、各アプリケーションがデータセットにアクセスする際のニーズに基づき、PIIを動的に編集(レダクション)するソリューションを実装する必要があります。 これらの要件を満たし、かつ運用オーバーヘッドが最小となるソリューションはどれですか?
- A. 各アプリケーションのアクセスを制限するS3バケットポリシーを作成します。データセットの複数のコピーを作成し、各コピーにアクセスするアプリケーションのニーズに応じた適切なレベルのPII編集を適用します。
- B. S3 Object Lambdaエンドポイントを作成します。このS3 Object Lambdaエンドポイントを使用してS3バケットからデータを読み取り、各アプリケーションのニーズに応じてPIIを動的に編集するロジックをS3 Object Lambda関数内に実装します。 ✓
- C. AWS Glueを使用して各アプリケーション向けにデータを変換します。データセットの複数のコピーを作成し、各コピーにアクセスするアプリケーションのニーズに応じた適切なレベルのPII編集を適用します。
- D. カスタムオーソライザーを備えたAPI Gatewayエンドポイントを作成します。このAPI Gatewayエンドポイントを使用してS3バケットからデータを読み取り、各アプリケーションのニーズに応じてPIIを動的に編集するREST API呼び出しを開始します。
正解: B. S3 Object Lambdaエンドポイントを作成します。このS3 Object Lambdaエンドポイントを使用してS3バケットからデータを読み取り、各アプリケーションのニーズに応じてPIIを動的に編集するロジックをS3 Object Lambda関数内に実装します。
解説
規制遵守を確保し、個人を特定可能な情報(PII)を不要に共有しないようにするためには、各アプリケーションがデータセットにアクセスする際のニーズに基づいてPIIを動的に編集するソリューションが必要です。運用オーバーヘッドを最小化するという要件を考慮し、各選択肢を検討します。選択肢Aは、各アプリケーションのニーズに応じて異なる編集レベルを持つデータセットの複数のコピーを作成するものです。この方法はデータの複製およびストレージコストを伴い、運用上の複雑さが高くなります。選択肢Bは、S3 Object Lambdaの使用を提案しています。この方法では、データの読み取り時に編集ロジックを動的に適用でき、データセットの複数のコピーを作成する必要がありません。これにより、ストレージ要件が削減され、各アプリケーションのニーズに応じてリアルタイムでデータを編集できます。したがって、運用オーバーヘッドが最小になります。選択肢Cは選択肢Aと類似しており、AWS Glueによるデータ変換およびデータセットの複数コピー作成を伴うため、高い運用オーバーヘッドを伴います。選択肢Dは、API Gatewayを使用し、REST API呼び出しによってPIIを動的に編集するものです。この方法は柔軟性を提供しますが、追加のネットワーク呼び出しオーバーヘッドおよびAPI管理の複雑さを増加させます。したがって、運用オーバーヘッドを最小化するという観点から、選択肢B(S3 Object Lambdaの使用)が最も適したソリューションです。