Q40 — AWS DEA-C01 第1章
第 40/100 問 | ← 第1章
データエンジニアは、1つのAWS Lambda関数と1つのAWS Glueジョブから構成されるデータパイプラインをオーケストレーションする必要があります。このソリューションはAWSサービスと統合する必要があります。 これらの要件を最も少ない管理オーバーヘッドで満たすソリューションはどれですか?
- A. AWS Step Functionsワークフロー(ステートマシンを含む)を使用します。ステートマシンを設定して、Lambda関数を実行した後にAWS Glueジョブを実行するようにします。 ✓
- B. Amazon EC2インスタンスにデプロイされたApache Airflowワークフローを使用します。最初のタスクがLambda関数を呼び出し、2番目のタスクがAWS Glueジョブを呼び出す有向非巡回グラフ(DAG)を定義します。
- C. AWS Glueワークフローを使用してLambda関数とAWS Glueジョブを実行します。
- D. Amazon Elastic Kubernetes Service(Amazon EKS)にデプロイされたApache Airflowワークフローを使用します。最初のタスクがLambda関数を呼び出し、2番目のタスクがAWS Glueジョブを呼び出す有向非巡回グラフ(DAG)を定義します。
正解: A. AWS Step Functionsワークフロー(ステートマシンを含む)を使用します。ステートマシンを設定して、Lambda関数を実行した後にAWS Glueジョブを実行するようにします。
解説
正解はAです。AWS Step Functionsは、サーバーレスワークフローの調整および管理に特化したサービスであり、AWSサービスとの統合性が高く、管理オーバーヘッドが非常に小さいです。ステートマシンの設定により、AWS Lambda関数とAWS Glueジョブを順次実行することが容易に可能であり、複雑なデプロイおよび保守を必要としません。一方、選択肢BおよびDでは、Amazon EC2インスタンスまたはAmazon EKS上にApache Airflowをデプロイする必要があり、追加のインフラストラクチャ管理および設定が必要です。選択肢Cでは、AWS Glueワークフローのみを使用するため、Step Functionsほど柔軟かつ包括的なニーズを満たすことができません。したがって、総合的に見て、選択肢Aが要件を満たし、かつ管理オーバーヘッドが最小のソリューションです。