Q40 — AWS SAA-C03 第3章

第 40/65 問 | ← 第3章

Q170. オンライン小売企業は、5,000万人を超えるアクティブな顧客を抱えており、1日あたり25,000件を超える注文を受注しています。同社は顧客の購入データを収集し、これをAmazon S3に保存しています。その他の顧客データはAmazon RDSに格納されています。同社は、さまざまなチームが分析作業を実行できるよう、すべてのデータを各チームで利用可能にしたいと考えています。このソリューションは、データに対する細かい権限管理機能を提供する必要があり、かつ運用オーバーヘッドを最小限に抑える必要があります。これらの要件を満たすソリューションはどれですか?

正解: C. AWS Lake Formationを用いてデータレイクを作成する。AWS Glue JDBC接続をAmazon RDSに対して作成し、S3バケットをLake Formationに登録する。Lake Formationのアクセス制御を用いてアクセスを制限する

解説

5,000万人を超えるアクティブな顧客と1日25,000件を超える注文を処理するオンライン小売企業において、全顧客データを分析目的で複数のチームが利用可能にするとともに、細かい権限管理を実現し、運用オーバーヘッドを最小限に抑えるには、AWS Lake Formationを用いたデータレイクの構築が最適です。AWS Glue JDBC接続をAmazon RDSに設定し、S3バケットをLake Formationに登録することで、一元的にデータを統合・管理できます。さらに、Lake Formationのアクセス制御機能を活用すれば、ユーザー、グループ、属性、条件に基づいたきめ細かなデータアクセス制御が可能です。したがって、正解は選択肢Cです。選択肢Aは、アプリケーションアーキテクチャやデータベーススキーマへの大幅な変更を伴うため、非現実的です。選択肢Bは、Lambdaによる定期的なデータコピー、Glueクローラーの設定、Athenaクエリ、S3ポリシーによる制御など、手動設定が多く、スケーラビリティやコスト効率の面でデータレイクソリューションに劣ります。選択肢Dは、Redshiftクラスターの運用とLambdaによるデータ同期の管理が必要であり、コストやスケーラビリティの観点から、データレイクソリューションより劣ります。AWS Lake Formationは、Amazon S3上にサーバーレスかつ完全マネージドでスケーラブルなデータレイクを構築でき、Amazon RDSなどの外部データソースとの統合も容易です。また、ユーザー属性や条件に基づく細かいアクセス制御を提供し、大規模データのセキュアかつ堅牢・コスト効率の高い管理を実現します。