Q1 — AWS SAA-C03 第4章

第 1/105 問 | ← 第4章

Q196. 病院が、膨大な量の歴史的書類記録をデジタル化したいと考えています。病院では今後も毎日数百点の新規文書が追加され続けます。データチームがこれらの文書をスキャンし、AWSクラウドにアップロードします。ソリューションアーキテクトは、文書を分析し、医療情報を抽出して保存するソリューションを実装する必要があります。また、アプリケーションがそのデータに対してSQLクエリを実行できるようにする必要があります。このソリューションは、スケーラビリティと運用効率の最大化を達成しなければなりません。これらの要件を満たすために、ソリューションアーキテクトが実施すべき手順の組み合わせはどれですか?(2つ選択してください。)

正解: B. 文書情報をAmazon S3バケットに書き込む。Amazon Athenaを使用してデータをクエリする, E. 新規文書がアップロードされたときに実行されるAWS Lambda関数を作成する。Amazon Textractを使用して文書を生テキストに変換し、Amazon Comprehend Medicalを使用してテキストから関連する医療情報を検出し抽出する

解説

歴史的書類記録を分析し、医療情報を抽出・保存してSQLクエリを実行可能にするには、スケーラビリティと運用効率を最大限に高めるソリューションが必要です。新規文書のアップロードをトリガーとして実行されるAWS Lambda関数を作成し、Amazon Textractで文書を生テキストに変換し、Amazon Comprehend Medicalで医療情報を検出して抽出するのが最適です。その後、得られた文書情報をAmazon S3バケットに保存します。したがって、正解はオプションEおよびBです。オプションAは、Amazon EC2上で動作するMySQLデータベースに書き込むという手法ですが、これは毎日数百点もの新規文書を処理するのに必要なスケーラビリティを十分に提供できません。オプションCは、カスタムアプリケーションを実行するEC2インスタンスのAuto Scalingグループを作成する方法ですが、AWS Lambdaと比較すると運用上のオーバーヘッドが大きくなります。オプションDは、Amazon RekognitionとAmazon Transcribe Medicalを用いる手法ですが、文書のテキスト抽出精度や医療情報抽出の柔軟性という点で、Amazon TextractおよびAmazon Comprehend Medicalを用いる手法には劣ります。Amazon TextractとAmazon Comprehend Medicalを活用したLambda関数により、アップロードされた文書を正確かつ効率的に処理できます。また、文書情報をAmazon S3に保存することで、容易かつコスト効率の高いストレージが実現し、Amazon Athenaを用いたクエリ実行により、インフラのプロビジョニングや管理を必要とせずにSQLクエリが可能になります。このソリューションは、要件を満たしつつ、スケーラビリティと運用効率を最大限に高めます。