Gemini Embedding 2 実践ガイド — テキスト・画像・音声・動画を「同じ空間」に埋め込んで、マルチモーダルRAGを構築する【2026年3月最新】
AI要約
2026年3月にGoogleがリリースしたGemini Embedding 2は、テキスト・画像・動画・音声・PDFを同じベクトル空間に埋め込める世界初のマルチモーダル埋め込みモデルです。これまでRAGではコンテンツの種類ごとに異なるモデルを使う「継ぎ接ぎ問題」がありましたが、単一ベクトル空間で統一することで、テキスト質問と画像回答を直接比較できるようになります。Pythonの実装コード付きで、3072~768次元の柔軟な出力とMRL採用により、検索品質と計算コストのバランスを自在に調整できます。



