ある企業は、AWSクラウド上で実行されるデータソースのためのデータカタログおよびメタデータ管理を設定する必要があります。企業は、一連のデータストアに存在するすべてのオブジェクトのメタデータを維持するためにデータカタログを

Question

ある企業は、AWSクラウド上で実行されるデータソースのためのデータカタログおよびメタデータ管理を設定する必要があります。企業は、一連のデータストアに存在するすべてのオブジェクトのメタデータを維持するためにデータカタログを使用します。データストアには、Amazon RDSおよびAmazon Redshiftなどの構造化ソースが含まれます。また、Amazon S3に保存されているJSONファイルおよび.xmlファイルなどの半構造化ソースも含まれます。
企業は、定期的にデータカタログを更新するソリューションを必要としています。また、ソースメタデータの変更を検出する必要があります。
これらの要件を最も少ない運用オーバーヘッドで満たすソリューションはどれですか？

Accepted Answer

B. AWS Glue Data Catalogを中央メタデータリポジトリとして使用します。AWS Glueクローラーを使用して複数のデータストアに接続し、メタデータ変更をData Catalogに更新します。クローラーを定期的に実行するようスケジュールして、メタデータカタログを更新します。

Answer

A. データカタログとしてAmazon Auroraを使用します。AWS Lambda関数を作成し、データカタログに接続します。Lambda関数を構成して、複数のソースからメタデータ情報を収集し、Auroraデータカタログを更新します。Lambda関数を定期的に実行するようスケジュールします。

Answer

C. データカタログとしてAmazon DynamoDBを使用します。AWS Lambda関数を作成し、データカタログに接続します。Lambda関数を構成して、複数のソースからメタデータ情報を収集し、DynamoDBデータカタログを更新します。Lambda関数を定期的に実行するようスケジュールします。

Answer

D. AWS Glue Data Catalogを中央メタデータリポジトリとして使用します。Amazon RDSおよびAmazon Redshiftソースのスキーマを抽出し、Data Catalogを構築します。Amazon S3内のデータに対してAWS Glueクローラーを使用してスキーマを推論し、Data Catalogを自動的に更新します。

Q41 — AWS DEA-C01 第1章

解説