#embedding

3件の記事

RoPEを丁寧に読む — Section 3「提案手法」完全解説

RoPEの論文を深掘りする完全解説です。既存の位置埋め込みが相対位置を自然に扱えない問題を踏まえ、内積が相対位置m-nだけに依存する条件を数式で定式化。2次元での複素数表現から一般次元への拡張まで、導出・直感・行列形式を丁寧に示します。位置m応じた角度θ_iだけ回転させるシンプルな操作が、なぜ相対位置符号化を実現するのかが体感できます。

#RoPE #位置埋め込み #Transformer

記事を読む →

📚

Qiita4月7日· 2分で読める中級🔥 注目

RAGの検索精度を3軸で測ったら最適解が条件で全く変わった

RAGの実装で「BGE-M3が安定」「ベクトル検索で十分」というよくある推奨は、実は条件次第で全く変わります。日本語テクニカル記事1,500チャンクで実測したら、E5-smallがBGE-M3より9倍速く品質も同等、BM25は形態素解析を入れるだけでスコアが63%改善。最大の発見は「日本語トークナイザの問題が全ての元凶」だったことです。アルゴリズム選択より基盤の壊れた部分を直すことが重要という、実装者が直面する本当の課題が見えます。

#RAG #技術・実装 #日本語LLM

記事を読む →

📚

Qiita3月30日· 2分で読める上級🔥 注目

Oracle 23ai → PostgreSQL+pgvector 移行記：embedding 384次元→3072次元同時移行でRAG精度51%改善した話

本番RAGシステムをOracle 23aiからPostgreSQL+pgvectorに移行した実録です。同時にembeddingモデルを384次元から3,072次元に刷新し、検索精度が51%改善しました。Oracle Freeの12GB制限に直面し、HNSW作成失敗・undo破損など連鎖障害を経験。移行手順・コスト実績・具体的なはまりポイントまで、実装者視点で詳細に解説しています。

#RAG #PostgreSQL #pgvector

記事を読む →