Q270. ある会社が、IoTデバイスのファleetから大量のデータを収集しています。このデータは、永続的なAmazon EMRクラスター上のHadoop分散ファイルシステム（HDFS）に、Optimized Row C

Question

Q270. ある会社が、IoTデバイスのファleetから大量のデータを収集しています。このデータは、永続的なAmazon EMRクラスター上のHadoop分散ファイルシステム（HDFS）に、Optimized Row Columnar（ORC）形式で格納されています。

同社のデータ分析チームは、同じEMRクラスター上で実行されるApache Prestoを使用してSQLでデータをクエリしています。

クエリは大量のデータをスキャンし、常に15分未満で完了しますが、実行時間は毎日午後5時から午後10時の間のみに限定されています。

現在のソリューションに関連するコストが高額であることに懸念を抱いている同社に対し、ソリューションアーキテクトは、SQLによるデータクエリを可能にする最もコスト効率の高いソリューションを提案する必要があります。

これらの要件を満たすソリューションはどれですか？

Accepted Answer

B. データをAmazon S3に格納する。
AWS Glue Data CatalogとAmazon Athenaを使用してデータをクエリする。

Answer

A. データをAmazon S3に格納し、Amazon Redshift Spectrumでクエリを実行する。

Answer

C. データをEMR File System（EMRFS）に格納し、Amazon EMR上のPrestoを使用してデータをクエリする。

Answer

D. データをAmazon Redshiftに格納し、Amazon Redshiftを使用してデータをクエリする。

Q45 — AWS SAP-C02 第3章