Q43 — AWS SAA-C03 第3章

第 43/65 問 | ← 第3章

Q173. ある企業が、複数のソースからリアルタイムストリーミングデータをインジェストする新しいデータプラットフォームを準備しています。この企業は、データをAmazon S3に書き込む前に変換する必要があります。また、変換後のデータをSQLでクエリできる機能も必要です。 これらの要件を満たすソリューションはどれですか?(2つ選択してください。)

正解: A. Amazon Kinesis Data Streams を使用してデータをストリーミングします。Amazon Kinesis Data Analytics を使用してデータを変換します。Amazon Kinesis Data Firehose を使用してデータをAmazon S3に書き込みます。Amazon Athena を使用してAmazon S3から変換後のデータをクエリします。, B. Amazon Managed Streaming for Apache Kafka(Amazon MSK)を使用してデータをストリーミングします。AWS Glue を使用してデータを変換し、Amazon S3に書き込みます。Amazon Athena を使用してAmazon S3から変換後のデータをクエリします。

解説

リアルタイムストリーミングデータの複数ソースからのインジェスト、Amazon S3への書き込み前のデータ変換、およびSQLによる変換後データのクエリという要件を満たすには、データのストリーミングにAmazon Kinesis Data StreamsまたはAmazon Managed Streaming for Apache Kafka(Amazon MSK)を用いるのが適切です。データ変換にはAWS GlueまたはAmazon Kinesis Data Analyticsを活用でき、その後Amazon Kinesis Data FirehoseでAmazon S3へ書き込むことができます。最終的に、Amazon S3上の変換済みデータをクエリするにはAmazon Athenaが最適です。したがって、選択肢AおよびBが正解です。 選択肢Cでは、データインジェストにAWS Database Migration Service(AWS DMS)が提案されていますが、これはリアルタイムストリーミングデータ向けではなく、主にデータベース間の移行やCDC(Change Data Capture)用途に設計されています。また、Amazon EMRを用いた変換・書き込みは、スケーラビリティやコスト効率の観点で、AWS GlueやAmazon Kinesis Data Analyticsを用いるより過剰な複雑さを伴います。 選択肢DおよびEでは、Amazon RDSクエリエディタを用いてAmazon S3上のデータをクエリしようとしていますが、これは不適切です。Amazon RDSはリレーショナルデータベースサービスであり、S3上のオブジェクトストレージデータを直接クエリする機能を持ちません。代わりに、S3上のデータをSQLでクエリするにはAmazon Athenaが標準かつ最適なサービスです。したがって、DおよびEは追加の不要な複雑さを導入し、スケーラビリティやコスト効率も劣ります。 Amazon Kinesis Data StreamsおよびAmazon MSKは、リアルタイムストリーミングデータのインジェストに高いスケーラビリティと耐久性を提供します。AWS GlueまたはAmazon Kinesis Data Analyticsを組み合わせることで、Amazon Kinesis Data Firehoseを経由してAmazon S3へ変換済みデータを効率的に書き込むことが可能です。