Q87 — AWS AIF-C01 第2章

第 87/100 問 | ← 第2章

ある企業が、画像を含むPDF文書に対して意味検索を実行するソリューションを実装したいと考えています。この企業は、PDFから各画像を抽出し、画像を分析してそれぞれの文脈情報を取得し、その後、これらの情報を意味検索に活用することを計画しています。このような要件を満たすソリューションはどれですか?

正解: C. 大規模言語モデル(LLM)の使用

解説

企業が画像を含むPDF文書に対して意味検索を実行したいという要件において、鍵となるのはPDFから画像を抽出し、その文脈情報を分析して検索に活用することです。大規模言語モデル(LLM)は、画像を処理し、その文脈情報を理解する能力を持ち、これを意味検索に活用できます。一方、トークン化は主にテキスト処理に用いられ、画像の直接分析には対応しません。埋め込みは情報のベクトル表現への変換を指しますが、画像分析や意味検索の実行自体を担うものではありません。プロンプトエンジニアリングは、ユーザー入力を最適化して検索精度を向上させる手法であり、画像分析という根本的な課題を解決しません。したがって、LLMの使用が最も適切なソリューションです。