Q87 — AWS AIF-C01 第2章
第 87/100 問 | ← 第2章
ある企業が、画像を含むPDF文書に対して意味検索を実行するソリューションを実装したいと考えています。この企業は、PDFから各画像を抽出し、画像を分析してそれぞれの文脈情報を取得し、その後、これらの情報を意味検索に活用することを計画しています。このような要件を満たすソリューションはどれですか?
- A. トークン化(分詞)の使用
- B. 埋め込み(Embedding)の使用
- C. 大規模言語モデル(LLM)の使用 ✓
- D. プロンプトエンジニアリングの使用
正解: C. 大規模言語モデル(LLM)の使用
解説
企業が画像を含むPDF文書に対して意味検索を実行したいという要件において、鍵となるのはPDFから画像を抽出し、その文脈情報を分析して検索に活用することです。大規模言語モデル(LLM)は、画像を処理し、その文脈情報を理解する能力を持ち、これを意味検索に活用できます。一方、トークン化は主にテキスト処理に用いられ、画像の直接分析には対応しません。埋め込みは情報のベクトル表現への変換を指しますが、画像分析や意味検索の実行自体を担うものではありません。プロンプトエンジニアリングは、ユーザー入力を最適化して検索精度を向上させる手法であり、画像分析という根本的な課題を解決しません。したがって、LLMの使用が最も適切なソリューションです。