Q12 — AWS SAA-C03 第3章

第 12/65 問 | ← 第3章

Q142. ある企業では、複数のデータベースからバッチ形式でデータが生成され、またネットワークセンサーおよびアプリケーションAPIからライブストリーミング形式でデータが生成されます。この企業は、ビジネス分析のためにすべてのデータを1か所に統合する必要があります。また、受信したデータを処理した後、異なるAmazon S3バケットに段階的に格納(ステージング)する必要があります。その後、各チームが一時的なクエリを実行したり、データをBIツールにインポートしてキーパフォーマンスインジケーター(KPI)を可視化したりします。これらの要件を満たすとともに、運用オーバーヘッドを最小限に抑えるための手順の組み合わせはどれですか?(該当する2つを選択してください。)

正解: A. 一時的なクエリにはAmazon Athenaを使用し、KPIダッシュボードの作成にはAmazon QuickSightを使用します。, E. AWS Lake Formationのブループリント機能を活用してデータレイクへの取り込み対象データを特定し、AWS Glueでソースをクロールしてデータを抽出・変換し、Apache Parquet形式でAmazon S3にロードします。

解説

正解はAとEです。A:Amazon Athenaは、Amazon S3上のデータに対してSQLクエリを実行できるサーバーレスなインタラクティブクエリサービスであり、一時的なクエリやBIツールとの連携に最適です。QuickSightは、Athenaをデータソースとして直接利用でき、KPIダッシュボードの構築に最小限の設定で対応できます。E:AWS Lake Formationのブループリントは、データソースの自動検出・分類を支援し、AWS Glueによるスキーマ発見(クロール)、ETL処理、およびParquet形式でのS3への最適化されたロードを簡素化します。Parquetは列指向フォーマットであり、Athenaによる高速クエリ実行に非常に適しています。一方、BはKinesis Data Analyticsが主にリアルタイムストリーミング分析向けであり、一時的・バッチクエリには不適切です。CはLambda+Redshiftの組み合わせはバッチ処理に過剰かつ管理負荷が高く、またRedshiftはステージング用S3バケットという要件に沿っていません。DはOpenSearch Serviceは全文検索・ログ分析向けであり、大規模なビジネス分析や一時クエリには非効率で、運用・コスト面でもオーバーヘッドが大きくなります。