Q80 — AWS AIF-C01 第3章
第 80/100 問 | ← 第3章
ある医療機器メーカーが、オンライン製品カタログにAI生成の製品概要を追加することを計画しています。同社は、業界特有の専門用語を含めることで生成結果の品質を向上させたいと考えています。MLチームは、大量の未ラベル化された業界標準および研究資料にアクセス可能です。このような要件を満たすML技術はどれですか?
- A. 編集済みのサンプルを次のプロンプトに含めるためにプロンプトエンジニアリングを活用すること
- B. 関連する専門用語を含めるために検索拡張生成(RAG)を活用すること
- C. データセット上で基礎モデルを継続的前訓練(continued pre-training)することでカスタマイズすること ✓
- D. 業界向けデータセットを用いたインストラクションベースのファインチューニングにより基礎モデルをカスタマイズすること
正解: C. データセット上で基礎モデルを継続的前訓練(continued pre-training)することでカスタマイズすること
解説
医療機器メーカーがAI生成の製品概要に業界特有の専門用語を統合したいという要件において、MLチームが大量の未ラベル化された業界標準および研究資料(=非構造化テキスト)にアクセス可能である点が鍵となります。RAG(検索拡張生成)は、リアルタイムで関連するドキュメントを検索し、それをプロンプトに組み込んで生成を行う手法であり、既存の知識ベース(ここでは業界資料)を活用しつつ、専門用語の正確な使用を保証できます。一方、ファインチューニングや継続的前訓練は、モデルの重み更新を伴うため、大量の計算リソースと専門的知識を要し、また、専門用語の即時反映や柔軟な更新が困難です。したがって、運用性・正確性・柔軟性の観点から、RAGが最も適した技術です。