Q35 — AWS SAA-C03 第3章

第 35/65 問 | ← 第3章

Q165. 支払い処理会社は、顧客との音声通話のすべてを記録し、その音声ファイルを Amazon S3 バケットに保存しています。この会社は、音声ファイルからテキストを抽出する必要があります。また、顧客に属する個人を特定できる情報(PII)を、抽出されたテキストから確実に削除しなければなりません。これらの要件を満たすために、ソリューションアーキテクトは何を行うべきでしょうか?

正解: C. PII 紅染(redaction)機能を有効化した Amazon Transcribe の文字起こしジョブを設定します。音声ファイルが S3 バケットにアップロードされた際には、AWS Lambda 関数を呼び出してこの文字起こしジョブを開始し、出力結果を別の S3 バケットに保存します。

解説

Amazon Transcribe は、音声データを自動的にテキストに変換するマネージドサービスであり、ネイティブで PII 紅染(redaction)機能をサポートしています。これにより、電話会話などの音声からテキストを生成する際に、SSN、クレジットカード番号、住所、氏名などの PII を自動的に検出し、マスキングまたは削除できます。オプション C は、S3 イベントをトリガーとして Lambda を介して Transcribe ジョブを起動し、PII 紅染を有効化した状態で実行するという、要件に完全に合致する正しいアプローチです。一方、オプション A の Kinesis Video Streams はリアルタイム動画ストリーム向けであり、バッチ音声ファイルの文字起こしには不適切です。オプション B の Amazon Textract はドキュメント(PDF、画像など)のテキスト抽出に特化しており、音声ファイルの処理には対応していません。オプション D の Amazon Connect は、インバウンド/アウトバウンドのカスタマーサポート通話を管理するためのコンタクトセンターサービスであり、既存の音声ファイルをバッチ処理する用途には設計されておらず、非効率かつ過剰なアーキテクチャです。