データエンジニアは、AWSサービスを用いてデータセットをAmazon S3データレイクに取り込む必要があります。データエンジニアがデータセットを分析したところ、個人を特定可能な情報（PII）が含まれていることがわかりまし

Question

データエンジニアは、AWSサービスを用いてデータセットをAmazon S3データレイクに取り込む必要があります。データエンジニアがデータセットを分析したところ、個人を特定可能な情報（PII）が含まれていることがわかりました。データエンジニアは、データセットを分析し、PIIを曖昧化（オブスキュレーション）するソリューションを実装する必要があります。
この要件を満たすために、最も少ない運用作業量で実現できるソリューションはどれですか？

Accepted Answer

B. AWS Glue StudioのDetect PII変換を使用してPIIを識別します。PIIを曖昧化します。AWS Step Functionsステートマシンを使用して、データをS3データレイクに取り込むデータパイプラインをオーケストレートします。

Answer

A. Amazon Kinesis Data Firehose配信ストリームを使用してデータセットを処理します。PIIを識別するAWS Lambda変換関数を作成します。AWS SDKを使用してPIIを曖昧化します。配信ストリームのターゲットとしてS3データレイクを設定します。

Answer

C. AWS Glue StudioのDetect PII変換を使用してPIIを識別します。AWS Glue Data QualityでPIIを曖昧化するルールを作成します。AWS Step Functionsステートマシンを使用して、データをS3データレイクに取り込むデータパイプラインをオーケストレートします。

Answer

D. データセットをAmazon DynamoDBに取り込みます。DynamoDBテーブル内のPIIを識別・曖昧化し、データを変換するAWS Lambda関数を作成します。同じLambda関数を使用して、データをS3データレイクに取り込みます。

Q17 — AWS DEA-C01 第1章

正解: B. AWS Glue StudioのDetect PII変換を使用してPIIを識別します。PIIを曖昧化します。AWS Step Functionsステートマシンを使用して、データをS3データレイクに取り込むデータパイプラインをオーケストレートします。

解説