13件の記事
2026年3月にGoogleがリリースしたGemini Embedding 2は、テキスト・画像・動画・音声・PDFを同じベクトル空間に埋め込める世界初のマルチモーダル埋め込みモデルです。これまでRAGではコンテンツの種類ごとに異なるモデルを使う「継ぎ接ぎ問題」がありましたが、単一ベクトル空間で統一することで、テキスト質問と画像回答を直接比較できるようになります。Pythonの実装コード付きで、3072~768次元の柔軟な出力とMRL採用により、検索品質と計算コストのバランスを自在に調整できます。