Qiita· 2分で読める中級🔥 注目
Gemini Embedding 2入門 — テキスト・画像・動画を単一ベクトル空間で扱うAPIガイド
Google がリリースした Gemini Embedding 2 は、テキスト・画像・動画・音声・PDF を単一ベクトル空間に統一できるネイティブマルチモーダル埋め込みモデルです。従来は画像をテキストに変換してから埋め込みしていましたが、中間ステップを排除することで最大70%のレイテンシ削減を実現。3,072次元出力、MRL による次元調整、8種類のタスクタイプ指定に対応し、Python実装例と RAG応用パターンを具体的に解説しています。