LLM News
モデル・基盤AI駆動開発技術・実装エージェントビジネス・活用
📅 今日のまとめ♡☆

LLM News

LLM・VibeCoding・AI駆動開発に関する最新記事をキュレーションしてお届けします。

𝕏RSS

ナビゲーション

  • トップ
  • タグ一覧
  • 検索
  • About
  • プライバシーポリシー

人気タグ

#LLM#Claude#VibeCoding#AI駆動開発#RAG#エージェント#プロンプトエンジニアリング#GPT-4

© 2026 LLM News

← トップへ

Zenn

30件の記事

📚
Zenn4月7日· 2分で読める中級🔥 注目

# NLP2026(言語処理学会第32回年次大会)のポスター発表に参加してきました!

COTENがNLP2026で発表した2つの研究が興味深いです。歴史調査向けRAGシステムのログ分析から、専門家と非専門家の「問い方」に明確な違いを発見。また、歴史テキストから国家間の関係構造を動的に抽出・可視化するシステムを開発し、1900~1970年にかけて国際関係の中心が西欧から米ソへ移る様子を捉えました。企業がアカデミアと協働する実践的な事例として、RAG開発やNLPの実装課題を抱えるエンジニアにとって参考になる具体的な知見が豊富です。

#RAG#NLP#LLM
記事を読む →
📚
Zenn4月6日· 2分で読める中級🔥 注目

クラウド上の機密PDFを、URLを漏らさずブラウザで安全に見せる方法

RAGベースのAIチャットエージェントで、機密PDFを安全に配信する実装が難題です。署名付きURLをブラウザに渡す方式では、URL流出・内部構造露出・ログ分散・IP制限の破綻が起きます。これらを解決するのが、バックエンドが中継する「リバースプロキシ」アーキテクチャです。論理IDのみクライアントに渡し、認証・認可・監査ログをバックエンドで一元管理。実装パターンと設計原則を詳しく解説しており、実務で即応用できます。

#RAG#セキュリティ#バックエンド設計
記事を読む →
📚
Zenn4月5日· 2分で読める中級🔥 注目

DuckDBでローカルRAGを作ってClaude Codeから使う

PDFやドキュメントをローカルでRAG化し、Claude Codeから直接検索できるシステムの実装ガイドです。DuckDBのベクトル検索機能(vss拡張)を活用すれば、インストール1行・サーバー不要・従量課金なしで実現できます。/rag-indexでMarkdownをチャンク化してembedding化、/rag-askで質問に対して意味的に最適なチャンクを取得して回答生成する2つのコマンドの構造を、テーブル設計からベクトル検索クエリまで具体的に解説しています。

#RAG#DuckDB#Claude Code
記事を読む →
📚
Zenn4月5日· 2分で読める中級🔥 注目

Spanner不要?Vertex AI RAG Engineに待望の「サーバーレスモード」が登場

Vertex AI RAG Engineにサーバーレスモードがプレビュー公開され、Cloud Spannerのプロビジョニングが不要になりました。Vector Search 2.0をバックエンドに、インフラ管理を完全にGoogleに委ねながら、数分でRAG環境を立ち上げられます。アイドル時のSpannerコストが消えるため、開発・テスト環境でコスト削減が期待でき、RAG構築の新しいスタンダードが生まれます。

#RAG#Vertex AI#Google Cloud
記事を読む →
📚
Zenn4月3日· 1分で読める中級🔥 注目

技術調査 - Jina Reader

Jina Readerは、URLを指定するだけでLLM向けのMarkdownコンテンツに変換するAPI群です。Web検索と本文抽出を1リクエストで実行でき、RAG・エージェント構築に必須のコンポーネント。VLMによる画像キャプション生成、複数出力形式、無料枠10Mトークンが特徴で、Firecrawl・Diffbotとの比較表も実装判断に役立ちます。

#RAG#技術・実装#Web Scraping
記事を読む →
⚡
Zenn4月2日· 2分で読める中級🔥 注目

Raspberry Pi 5で自己完結型AIナレッジ基盤を作ってみた

Raspberry Pi 5(16GB)でAPI代ゼロのオンプレAIナレッジ基盤を構築した実例です。FastAPI + Ollama(Gemma3 7B)+ ChromaDB + Redisで月額電気代100円以下を実現。GitHub IssueやRSSを自動収集→ベクトル化し、RAG応答は8秒(量子化で3〜4秒)。クラウド費用削減とデータ主権を両立させた、即実装できるノウハウが詰まっています。

#AI駆動開発#RAG#エージェント
記事を読む →
📚
Zenn3月31日· 2分で読める中級🔥 注目

RAGチャットボットをどう設計するか—会話で固めた構成

ポートフォリオにRAGチャットボットを実装する際の設計判断を、会話形式で丁寧に解説しています。Vector DBはpgvectorが最適、Chunkingは見出し単位で最大1200文字+150文字オーバーラップ、EmbeddingはOpenAIを使用といった具体的な構成決定と、事前準備とリアルタイム処理の2フェーズ設計フローが参考になります。FastAPI+PostgreSQL環境での実装に直結する知見が詰まっています。

#RAG#技術・実装#pgvector
記事を読む →
📚
Zenn3月31日· 1分で読める中級🔥 注目

連載「弱みはAIに、強みは自分に。」 第4回 AIに渡す知識基盤の設計論-「覚える」より「どこに何を置くか」が9割

AIエージェントの知識基盤設計で重要なのは、ChromaDBとSQLiteの使い分けです。長期記憶には意味検索に強いChromaDB、短期記憶には構造化クエリに強いSQLiteを配置する。著者の失敗経験から「全部RAGに入れる」アンチパターンと、情報の置き場所で品質が9割決まる実装論が学べます。

#RAG#ChromaDB#Claude Code
記事を読む →
📚
Zenn3月28日· 2分で読める中級🔥 注目

数千本の動画ライブラリにRAG検索を導入して社内AIコンテストで優勝した話

数千本の動画ライブラリをRAG検索で有効活用した実例です。最初はベクトル検索を試みましたが、同一ドメインの大量コンテンツでは意味的距離が近すぎて検索精度が落ちることに気付きました。Elasticsearchの全文検索と日本語形態素解析を導入することで、0件だったクエリが関連動画を確実に返すようになりました。さらに「検索Bot」と「質問Bot」を分離したことで両方のハルシネーション低減と精度向上を実現しています。技術選定から運用まで、実装に直結したノウハウが詰まっています。

#RAG#Elasticsearch#Dify
記事を読む →
📚
Zenn3月27日· 1分で読める中級🔥 注目

Dify×RAGで社内FAQチャットボットを構築する手順ガイド

Difyとい実装ノウハウが詰まった社内FAQチャットボット構築ガイドです。セットアップからLLM設定、ナレッジベース作成、チューニング、Teams/Slack連携まで、実際に手を動かしながら構築できます。チャンク設定200〜300トークンやTop-K調整など、精度を上げるための具体的なノウハウが記載されており、すぐに自社で応用できます。

#RAG#Dify#AI駆動開発
記事を読む →
⚡
Zenn3月26日· 2分で読める中級🔥 注目

LangChainの全APIコールを1行で自動記録する — llm-devproxy v0.4

LangChainのAPIコール監視が1行のコードで実現できるようになりました。llm-devproxy v0.4では、callbacks に DevProxyCallbackHandler を追加するだけで、OpenAI・Anthropic・Gemini の全APIコールを自動記録します。入出力トークン数・コスト・実行時間が即座に表示され、推論モデルの推論トークンも自動検出。Agent1実行で複数のAPIコールが発生する場合、その全体像を把握でき、月額コストの予期しない増加を防げます。

#LangChain#AI駆動開発#プロンプトエンジニアリング
記事を読む →
📚
Zenn3月26日· 2分で読める中級🔥 注目

RAGとMCPで広がるAIチャットの可能性──Helix AI Studioの実装ガイド

RAGとMCPを組み合わせたAIチャットアプリ「Helix AI Studio」の実装ガイドです。ChromaDBによるベクトル検索、チャンク分割設計、MCPによる外部ツール連携、Mem0でのセッション間メモリ保持など、実装コード付きで詳解されています。7つのAIプロバイダー対応で、Docker・Render対応のオープンソースプロジェクトため、すぐに試せます。

#RAG#MCP#AI駆動開発
記事を読む →
🔌
Zenn3月24日· 2分で読める中級🔥 注目

連載『弱みはAIに、強みは自分に。』第2回 情報取得設計編 — Hookの"お願い"からMCPの"強制"へ

AIが嘘をつくのではなく「古い記憶で答えている」という本質を実例で解説します。X API料金情報の失敗事例から、RAG・メモリ・SQLite・Web検索の4つのデータソースの優先順位制御が重要だと気づき、MCPを使った統合検索エンジン設計で「プロンプトのお願い」から「強制」へシフト。ChromaDB約16万チャンク、SQLite構造化データ、2層メモリ構造など、実装レベルの設計思想が詰まった実践ガイドです。

#Claude Code#MCP#RAG
記事を読む →
📚
Zenn3月21日· 2分で読める中級🔥 注目

CMSまで立ち戻ってRAGを考えてみた

RAGの精度を高めるには、データ抽出段階の工夫だけでは不十分です。この記事は逆算的な発想で、CMS段階からMarkdown統一フォーマットでマニュアルを管理し、グラフDB+ベクトル検索を組み合わせるアプローチを提案しています。BookRAGの構造化手法を活かすため、ドキュメント作成段階から情報の階層性を設計することで、RAG構築の課題をスキップできる実装例を示しています。

#RAG#CMS#実装
記事を読む →
📚
Zenn3月20日· 1分で読める中級🔥 注目

企業向けAIチャットボットの設計と実装

企業向けAIチャットボットは回答精度・安全性・運用性が求められる業務システムです。本記事は、PoCから本番運用まで見据えた実装方法を、UI・API・検索・LLMの各レイヤーに分けて詳解。ナレッジ投入・Chunking設計・権限制御など実務的なポイントが充実しており、具体的な技術スタック例も示されています。

#RAG#チャットボット#AI駆動開発
記事を読む →
🕵️
Zenn3月18日· 1分で読める中級🔥 注目

【2026年版】AIエージェント開発入門を公開しました

ChatGPTとエージェントの決定的な違いは、前者が「質問に答える」だけなのに対し、後者は「自分で判断し、ツールを使い、目標を達成する」ことです。2026年版の入門書では、Function Calling・RAG・LangGraph・MCP等を実装レベルで解説し、シングル/マルチエージェント、本番デプロイ、安全性まで全15章でカバーしています。

#エージェント#LangGraph#LangChain
記事を読む →
📚
Zenn3月15日· 2分で読める中級🔥 注目

TiDB Cloud Zero入門 — curlで作るDBにpytidbでベクトル検索

RAGやベクトル検索を試したいなら、TiDB Cloud Zeroが圧倒的に手軽です。curl1行でMySQL互換DBを構築でき、認証・登録・課金が一切不要。公式PythonクライアントpytidbのAuto-Embeddingを使うと、テキスト挿入だけで自動ベクトル化・セマンティック検索が動きます。実装コード完全付きで、今日中にベクトル検索の仕組みを体感できます。

#RAG#VectorDB#Python
記事を読む →
📚
Zenn3月15日· 1分で読める中級🔥 注目

RTX 4080でRAGを自作する — Ollama × ChromaDB × Python 150行の全記録

RTX 4080でOllama × ChromaDBを組み合わせ、外部API不要な完全ローカルRAGを実装する実践ガイドです。Python 150行で全処理を記述し、チャンクサイズ500文字・タイトル埋め込みなどの最適化テクニックを実測値(9.4秒E2E応答時間)とともに解説しています。月額0円で動く、手を動かしながら学べる内容です。

#RAG#Ollama#ChromaDB
記事を読む →
📚
Zenn3月14日· 1分で読める中級🔥 注目

RAGを使ったアプリ開発のススメ

RAGアプリ開発は従来型とは根本的に異なります。LLMの非決定論的な性質に対して、「期待値に対して何%応えられているか」という評価軸でシステムを定義する必要があります。ユースケース定義→教師データ作成→E2E評価→継続改善というループを回すことが重要で、特に評価基準の明示化と人間レビューの併用がプロダクト品質を左右します。

#RAG#技術・実装#AI駆動開発
記事を読む →
📚
Zenn3月14日· 1分で読める中級🔥 注目

Ollama × ローカルLLMに「記憶」を持たせる — Mem0の落とし穴と自前メモリ実装"

OllamaのローカルLLMに記憶機能を実装する際、Mem0ライブラリは次元数不一致とLLMの多重呼び出しによる性能低下という深刻な問題に直面します。本記事は、その落とし穴を明かしながら、ChromaDB + ノミック埋め込みモデルを用いた軽量な自前メモリ実装へのシフトを記録しており、ローカルLLM環境での実用的なメモリシステム構築の指針を提供します。

#Ollama#ローカルLLM#RAG
記事を読む →
📚
Zenn3月12日· 2分で読める中級🔥 注目

スクレイピングコード0行。Cloudflare Browser Rendering /crawl APIでチケットサイトを読ませた話。

Cloudflare Browser Rendering /crawl APIを使うと、CSSセレクタやスクレイピングコードを書かずにWebサイト情報を抽出できます。URLとJSON Schemaを投げるだけで、AIがJavaScriptレンダリングと構造化抽出を自動処理。チケットサイトから10+ヴェニューのイベント情報を手動作業から完全自動化した実装事例です。

#RAG#AI駆動開発#Cloudflare
記事を読む →
📚
Zenn3月12日· 2分で読める中級🔥 注目

RAGベースAIシステム導入事例と技術構成

企業のRAG導入事例から、実践的なシステム構築方法を学べます。NKKTech Globalが実装した事例をベースに、500~1000トークンのチャンキング設計、Hybrid Search+Re-ranking による検索精度改善、LangChainを使った実装コード、コスト最適化戦略まで、本番運用で必要なベストプラクティスが網羅されています。RAG vs Fine-tuningの使い分けも明確で、これからRAG導入する企業の実装ガイドになる内容です。

#RAG#技術・実装#ビジネス・活用
記事を読む →
📚
Zenn3月12日· 2分で読める中級🔥 注目

RAGで取得したユーザー記憶をホーム画面の吹き出しに反映する実装と、Reanimatedのstale closure問題

AI会話アプリでRAGを活用し、ユーザーの過去会話・エピソード記憶を反映した吹き出しフレーズをパーソナライズする実装例です。既存RAGインフラを新機能に最小コストで再利用する設計パターンと、React Native Reanimatedで遭遇したstale closure問題の解決策をコード付きで解説しており、フロントエンド・バックエンド双方の実装知見が得られます。

#RAG#React Native#AI駆動開発
記事を読む →
📚
Zenn3月11日· 2分で読める上級🔥 注目

Mastraを使ってAIエージェントを作ってみた

TypeScript製AIエージェントフレームワーク「Mastra」を、過去のPython実装と同じタスクで比較検証した連載記事です。型安全なワークフロー、スーパーバイザーパターンのマルチエージェント、組み込みRAGなど、TypeScript・Zod・Dev Playgroundで現代的なDX実現。2万スターの急成長フレームワークを実装コード付きで解説しており、フロント・バックエンド統一をめざすエンジニアに有用です。

#AIエージェント#Mastra#TypeScript
記事を読む →
📚
Zenn3月4日· 1分で読める上級🔥 注目

Agnoを使ってAIエージェントを作ってみた

Agnoという新興AIエージェントフレームワークを使い、LangGraphと同じRAG機能を実装しましたが、コード量が460行から230行に削減できました。設計思想の違いを体感できる連載第5回。AgnoはTeamによるマルチエージェント協調が標準機能で、手軽さが強みです。

#Agno#AIエージェント#RAG
記事を読む →
📚
Zenn3月4日· 1分で読める中級🔥 注目

Ragasで始めるRAG評価|4指標で“どこが悪いか”を特定する

RAGの品質が「なんとなく前より良くなった」では困りますよね。Ragasを使うとLLMが審査員になり、検索精度(Context Precision)と忠実性(Faithfulness)など4つの指標で定量的に評価できます。CI/CDに組み込める実装コード付きで、感覚値に頼らないRAG開発へ一歩前に進めます。

#RAG#技術・実装#Ragas
記事を読む →
⚡
Zenn3月3日· 2分で読める中級🔥 注目

Claude Code Skills で「使うほど賢くなる」投資分析AIを作った話 Vol.2【Neo4j × 個人開発】

Claude Code Skillsで投資分析AIを作り、Neo4jグラフDBを組み合わせることで「使うほど賢くなる」仕組みを実現した個人開発事例です。同じ質問を3回した時の回答品質の変化を通じて、自動コンテキスト注入・データ新鮮度判定・関係性別アクション提案といった設計パターンを実装。過去の分析結果・売買記録・投資メモが自動で蓄積され、次の判断に反映される循環ループの構築方法を、実装の工夫とともに詳しく解説しています。

#Claude Code Skills#AI駆動開発#RAG
記事を読む →
📚
Zenn3月3日· 2分で読める中級🔥 注目

「記憶」を持つAIエージェントを自作した | 【Knowledge Assistant】

LLMの「セッション終了で記憶がリセット」という根本的な制約を、RAG + MCP + ベクトルDBで解決したKnowledge Assistantを自作した事例です。設計書や業務ルールをVPN保護下のセマンティック検索で取得でき、月2,500円程度のコストで「自分専用AI」として機能します。個人開発者なら3日程度で構築でき、セッションをまたいだ知識継続が実現できます。

#RAG#MCP#Claude
記事を読む →
📚
Zenn3月3日· 1分で読める中級🔥 注目

AIチャットボット導入で業務効率を50%改善した事例

AIチャットボットで業務効率50%を実現するには、精度より運用設計が決定打です。RAGで根拠を返し、権限・監視・改善ループを組み込むことで、PoC止まりを回避できます。問い合わせ対応の工数削減を軸にKPIを定義し、人の調査時間を削ることが本体。チェックリスト付きで再現可能な実装戦略が学べます。

#RAG#AIチャットボット#LLM運用
記事を読む →
📚
Zenn3月3日· 1分で読める中級🔥 注目

ワンピースカードゲームの遊び方を教えてくれるAIチャットボット開発

バンダイナムコネクサスがワンピースカードゲームのルール検索をRAGで解決した事例です。PDFから探すしかなかった複雑なルールを、自然言語で気軽に問い合わせられるチャットボットに。GCP・Vertex AI・ChatGPTを組み合わせ、1年で利用回数が新カード追加時に山を形成するほど利用されています。プロンプト工夫・クエリ拡張・精度検証の実装詳細が学べます。

#RAG#チャットボット#ビジネス・活用
記事を読む →