LLM News
モデル・基盤AI駆動開発技術・実装エージェントビジネス・活用
📅 今日のまとめ♡☆

LLM News

LLM・VibeCoding・AI駆動開発に関する最新記事をキュレーションしてお届けします。

𝕏RSS

ナビゲーション

  • トップ
  • タグ一覧
  • 検索
  • About
  • プライバシーポリシー

人気タグ

#LLM#Claude#VibeCoding#AI駆動開発#RAG#エージェント#プロンプトエンジニアリング#GPT-4

© 2026 LLM News

← トップへ

#embedding

3件の記事

関連タグ

#技術・実装#RAG#実装ノウハウ#RoPE#位置埋め込み#Transformer#日本語LLM#検索精度#BM25#PostgreSQL
📰
Zenn4月8日· 1分で読める中級🔥 注目

RoPEを丁寧に読む — Section 3「提案手法」完全解説

RoPEの論文を深掘りする完全解説です。既存の位置埋め込みが相対位置を自然に扱えない問題を踏まえ、内積が相対位置m-nだけに依存する条件を数式で定式化。2次元での複素数表現から一般次元への拡張まで、導出・直感・行列形式を丁寧に示します。位置m応じた角度θ_iだけ回転させるシンプルな操作が、なぜ相対位置符号化を実現するのかが体感できます。

#RoPE#位置埋め込み#Transformer
記事を読む →
📚
Qiita4月7日· 2分で読める中級🔥 注目

RAGの検索精度を3軸で測ったら最適解が条件で全く変わった

RAGの実装で「BGE-M3が安定」「ベクトル検索で十分」というよくある推奨は、実は条件次第で全く変わります。日本語テクニカル記事1,500チャンクで実測したら、E5-smallがBGE-M3より9倍速く品質も同等、BM25は形態素解析を入れるだけでスコアが63%改善。最大の発見は「日本語トークナイザの問題が全ての元凶」だったことです。アルゴリズム選択より基盤の壊れた部分を直すことが重要という、実装者が直面する本当の課題が見えます。

#RAG#技術・実装#日本語LLM
記事を読む →
📚
Qiita3月30日· 2分で読める上級🔥 注目

Oracle 23ai → PostgreSQL+pgvector 移行記:embedding 384次元→3072次元同時移行でRAG精度51%改善した話

本番RAGシステムをOracle 23aiからPostgreSQL+pgvectorに移行した実録です。同時にembeddingモデルを384次元から3,072次元に刷新し、検索精度が51%改善しました。Oracle Freeの12GB制限に直面し、HNSW作成失敗・undo破損など連鎖障害を経験。移行手順・コスト実績・具体的なはまりポイントまで、実装者視点で詳細に解説しています。

#RAG#PostgreSQL#pgvector
記事を読む →