Q17 — AWS SAA-C03 第4章

第 17/105 問 | ← 第4章

Q212. ある病院が、Amazon API GatewayおよびAWS Lambdaを用いてRESTful APIを最近展開しました。この病院では、API GatewayとLambdaを用いてPDF形式およびJPEG形式のレポートをアップロードしています。病院は、Lambdaコードを変更して、これらのレポートに含まれる保護された健康情報(PHI)を特定する必要があります。これらの要件を満たすとともに、運用上のオーバーヘッドが最も少ないソリューションはどれですか?

正解: C. Amazon Textractを使用してレポートからテキストを抽出し、Amazon Comprehend Medicalを使用して抽出したテキストからPHIを特定します。

解説

RESTful API(Amazon API GatewayおよびAWS Lambdaで実装)にアップロードされるレポートから保護された健康情報(PHI)を特定する際、運用上のオーバーヘッドを最小限に抑えるには、Amazon Textractでレポートからテキストを抽出し、Amazon Comprehend Medicalで抽出されたテキストからPHIを特定する方法が最適です。したがって、正解は選択肢Cです。 選択肢Aは、既存のPythonライブラリを用いてテキスト抽出およびPHI検出を行うというものです。これは技術的には可能ですが、Amazon TextractおよびAmazon Comprehend Medicalを利用する場合と比較して、手動による設定・管理の負担が大きくなります。 選択肢Bは、Amazon Textractでテキスト抽出を行い、Amazon SageMakerでPHIを特定するというものです。これも可能ですが、医療データ分析に特化したマネージドサービスであるAmazon Comprehend Medicalと比べ、追加のインフラ管理やモデル訓練・デプロイのオーバーヘッドが発生します。 選択肢Dは、Amazon Rekognitionでテキスト抽出を行い、Amazon Comprehend MedicalでPHIを特定するというものです。Amazon Rekognitionは画像内のテキスト検出には対応していますが、文書解析(特にスキャン済みPDFや複雑なレイアウトの文書)には最適化されておらず、PHIの正確な検出には不十分な場合があります。 一方、Amazon Textractはスキャン済み文書やPDFから高精度なテキストおよび構造情報を抽出でき、Amazon Comprehend Medicalは医療分野の専門知識を活かした機械学習により、PHIを含む医療関連エンティティを自動的に識別できます。この組み合わせにより、カスタムコード開発や複雑なインフラ管理を必要とせず、迅速かつ信頼性の高いPHI検出を実現できます。よって、本問の要件を満たしつつ、運用オーバーヘッドを最小限に抑えるソリューションは選択肢Cです。