#ファインチューニング

23件の記事

【2026年最新】RAG精度改善技術のカオスマップ─ 74の技術を6カテゴリで構造的に整理した

RAG精度改善は簡単に作れても、実運用では「関係ない文書ばかりヒット」「ハルシネーション多発」という壁にぶつかります。この記事は、HyDEやGraphRAGなど74の技術を「DB構築→検索クエリ生成→検索→後処理→生成パイプライン→LLMモデル」の6カテゴリ17小分類で整理。自分のRAGのボトルネックを特定し、対応する技術を素早く見つけられる実践的なガイドになっています。

#RAG #技術・実装 #プロンプトエンジニアリング

記事を読む →

📰

Zenn4月5日· 2分で読める上級🔥 注目

RTX 4080で挑む強化学習コードLLM — 実行フィードバックで1.5Bモデルを鍛える全記録

RTX 4080という一般的なGPUで1.5BのコードLLMを強化学習で鍛える手法を完全解説しています。SFTの限界を超えて、実行フィードバックを活用したGRPO（Group Relative Policy Optimization）の実装から、HumanEvalベンチマークでの改善効果測定まで、すべてが実装コード付きで学べます。失敗事例も含む実践的なナレッジで、ローカル環境でのLLM最適化に取り組むエンジニア必読です。

#強化学習 #コード生成 #ファインチューニング

記事を読む →

🧠

Qiita4月4日· 2分で読める上級🔥 注目

【実践】Gemma4-31BをQLoRAで日本語エージェントに特化させる手順とベンチマーク

Gemma4-31BをQLoRAで日本語エージェントに特化させた実装レポートです。ClippableLinearやmm_token_type_idsといったGemma4特有のハマりポイント解決法を公開。1,546サンプルでファインチューニングした結果、Function Calling・Multi-step ReActで+2.0の性能向上を達成。Claude Codeのトークン消費削減を目指すローカルサブエージェント構築の実践的なノウハウが詰まっています。

#LLM #QLoRA #ファインチューニング

記事を読む →

⚡

Zenn4月3日· 2分で読める上級🔥 注目

【Claude Code × Colab 第5弾】時系列の次は衛星画像──EuroSATでResNet50が97.8%を出した話

Claude CodeとGoogle Colabで衛星画像分類に挑戦し、EuroSATデータセット上でResNet50が97.84%の精度を達成した実装記です。衛星画像特有のAugmentation（回転・反転）や2段階ファインチューニング、Grad-CAMによる注目領域の可視化まで、手を動かしながら画像分類の実装ノウハウを学べます。シリーズ5弾目として、時系列予測から画像分類への領域拡張の道筋も示しており、CNNとドメイン固有の工夫の組み合わせが体感できます。

#Claude Code #AI駆動開発 #ディープラーニング

記事を読む →

🧠

Zenn4月2日· 2分で読める上級🔥 注目

# 青空文庫11冊でLLMをゼロから作ったら、意外と日本語を喋った話

青空文庫11冊（約104万文字）でLLMを実装したら、5時間で動く日本語生成モデルが完成しました。Transformerアーキテクチャ・数百万パラメータという超ミニチュア版でも、意味は不完全でも文法的に正しい日本語を生成します。Claude Codeを活用した実装過程と、Self-Attention・Position Embeddingなど必須コンポーネントの仕組みをコード付きで解説。「次の文字を予測し続けるシステム」という本質を体感できます。

#LLM #Transformer #AI駆動開発

記事を読む →

🧠

Qiita3月27日· 2分で読める上級🔥 注目

FT-LLM 2026 チーム・ビクトリー解法推論パート

NLP2026のコンペティションでLLMの数学推論タスクに84.7%の正解率で優勝したチーム・ビクトリーが、Self-Consistency（多数決）推論手法の実装詳細を公開しています。同じ問題をCoTで複数回解かせ最頻出答を選ぶシンプルながら効果的な方法論と、vLLMを用いた実装パターン、temperatureやk値などの最適化探索プロセスが具体的コード付きで解説されています。

#LLM #推論最適化 #Self-Consistency

記事を読む →

⚡

Zenn3月27日· 2分で読める上級🔥 注目

ルーブリックに基づく主観的な判定を取り入れたGRPO学習

ルールベースの判定が難しいタスクに対して、GRPO学習にVLMベースの主観的報酬関数を組み込む実装方法を紹介しています。スライド生成タスクを例に、HTML出力をスクリーンショット化して視覚的に評価する仕組みを構築。vLLMで報酬計算用VLMを分離し、学習ノードとの効率的な連携方法を実装コード付きで解説しており、マルチモーダルな実務タスクへの適用可能性を示しています。

#GRPO #VLM #ファインチューニング

記事を読む →

🧠

Qiita3月25日· 2分で読める上級🔥 注目

海外LLMを日本仕様に「再調整」する — Sakana AI Namazuの事後学習技術が開く新しい可能性

Sakana AIが発表した「Namazu」は、海外LLMを日本の文脈に適応させる事後学習技術です。DeepSeek・Llama・OpenAIのOSSモデルをベースに、ゼロから作り直さず「調整」で日本仕様化。独自データセットと学習率調整により、元の推論・コーディング能力を保ちながら日本の政治・歴史・外交への適切な回答を実現します。既存モデルの性能を損なわない文脈適応の実践的アプローチです。

#LLM #日本語LLM #ファインチューニング

記事を読む →

📚

Qiita3月22日· 2分で読める上級🔥 注目

「RAGの精度が出ない」を解決する — ドメイン特化型Embeddingモデルを1日でファインチューニングする実践ガイド【2026年春版】

RAGの精度が出ない根本原因は、汎用Embeddingモデルがドメイン特有のニュアンスを捉えられていないことです。NVIDIAとHugging Faceの最新レシピなら、LLMが自動生成した訓練データを使い、1台のGPUで1日以内にドメイン特化型Embeddingを作成できます。手動ラベリング不要で、医療・製造・法律など専門領域のRAG精度を劇的に改善する実装方法を解説しています。

#RAG #Embedding #ファインチューニング

記事を読む →

⚡

Zenn3月18日· 2分で読める上級🔥 注目

建設現場の人手不足を解決！AIセコカン「Arch Intelligence」で生産性2倍を目指す3つの革新

建設業界の深刻な人手不足を解決するため、大阪の株式会社Archが「AIセコカン」Arch Intelligenceを発表しました。汎用AIではなく、各建設会社の過去データ・ノウハウを学習させた「その会社専用のAI」として機能するのが特徴です。危険予知活動のデジタル化から始め、書類作成・安全管理・工程管理をAI化することで、施工管理者1人あたりの生産性を2倍に引き上げることを目標としています。

#AI駆動開発 #ファインチューニング #エージェント

記事を読む →

⚡

Zenn3月18日· 2分で読める上級🔥 注目

【第1章】ディズニーのように動くVTuberを、最新AIでリアルタイムに作りたい

ディズニーレベルの滑らかさでリアルタイム動作するAI VTuberを実現する方法を解説します。音声から口の動きへの変換が最大の課題で、著者は世界の7つのAIモデルを比較し、品質最強モデルの知識を速度最強モデルに学習させるアプローチで、精度を0.13から0.89に改善。推論速度はリアルタイムの75倍を実現し、日本語特化版LAM-jaを開発しました。Claude Codeの活用例も示しています。

#AI駆動開発 #VTuber #リアルタイム処理

記事を読む →

🕵️

Qiita3月17日· 2分で読める上級🔥 注目

松尾研LLMコンペ2025 アドバンスド参戦記 — 100+モデル作って学んだこと

松尾研LLMコンペで100以上のモデルを試行錯誤した実験レポートです。効いた施策はハイパーパラメータ探索（LoRA rank=32が最適）、Instruction Masking、フォーマット統一など。重要な失敗知見として「eval_lossは性能を予測しない」「rankは大きいほど良くない」「モデルマージは万能ではない」を実証。実装者にとって即座に応用できる、生の知識が詰まっています。

#ファインチューニング #LoRA #エージェント

記事を読む →

🧠

Qiita3月17日· 2分で読める上級🔥 注目

Private LLMを使ってオンプレ版26aiのSELECT AIを外部サービス連携なしで動かしてみた

Oracle Database 26aiのSELECT AIを、外部サービス連携なしでオンプレミスのPrivate LLMで完全に動かす実装ガイドです。Llama.cppでローカルLLMをデプロイし、In-Database EmbeddingでRAGまで対応した具体的な構成手順を公開しており、機密データの外部流出を避けながらAIを活用したい企業に重要な実装事例です。

#LLM #AI駆動開発 #エージェント

記事を読む →

🧠

Qiita3月15日· 2分で読める上級🔥 注目

エッジ型SIEM基盤実装（OSS推進フォーラム）

セキュリティ運用の課題を解決するため、ローカルLLMとManticoreSearchを組み合わせたエッジ型SIEM基盤の実装を紹介しています。LLaMA2をLoRAでファインチューニングしGGUF量子化することで、わずか4GBのモデルでCPU推論を実現。ルールベース検知の限界を超え、複数ログの文脈的相関分析を自動化し、クラウド依存を排除しながら説明可能な脅威検知が可能になります。

#LLM #LLaMA #エッジAI

記事を読む →

📰

Qiita3月14日· 1分で読める上級

最適化アルゴリズム（Adam・SGD）って何だろう？

ニューラルネットワークの学習を支える最適化アルゴリズムAdamとSGDの違いを解説しています。勾配降下法の基礎から、動的学習率を備えたAdamがなぜ現代のディープラーニングで主流なのかを図解で理解できます。ファインチューニングやモデル学習時の重要な概念です。

#モデル・基盤 #ファインチューニング #機械学習

記事を読む →

🧠

Zenn3月14日· 1分で読める上級🔥 注目

SDG-LOOM — LLMによる大規模合成データ生成フレームワーク

LLMでの大規模合成データ生成を、コード不要で実現するフレームワークSDG-LOOMが登場しました。YAMLでパイプラインを宣言的に定義し、適応型並列制御やバッチ処理を自動化することで、数万～数十万件規模のデータセットを安定生成できます。GUIエディタも備え、エンジニア以外も参加可能な環境を実現。ファインチューニングやNLPデータ拡張に即戦力となります。

#合成データ生成 #LLM #データセット

記事を読む →

🧠

Qiita3月11日· 1分で読める上級🔥 注目

Unslothを活用したLlama-3.1-8BのファインチューニングとGGUF変換・ローカル移行の実践

Unslothを使うとLlama-3.1-8Bを2倍速い学習速度で、メモリ70%削減しながらファインチューニング可能です。本記事では、Google ColabのT4 GPU無料枠でLLMを学習させ、GGUF形式に変換してローカルPCで動かす完全な実装フローを手順付きで解説しており、エンジニアが実際に手を動かしながら習得できます。

#ファインチューニング #Unsloth #Llama-3.1

記事を読む →

🧠

Qiita3月9日· 2分で読める上級🔥 注目

「松尾研LLM講座2025応用編」アドバンスドコンペの感想をまとめてみた

東大松尾研のLLM講座2025応用編で、約200名の上位参加者が競ったアドバンスドコンペに参加した体験記です。AgentBenchという複数ターンのインタラクションを要するベンチマークで、Qwen系の小規模モデルにSFT・DPOで追加学習を施し精度を競います。従来の「単発回答」と異なり、「環境との相互作用を通じて目標を自律達成するエージェント型AI」の能力評価という、新しいLLMの評価軸を垣間見られる貴重な記事です。

#LLM #エージェント #SFT

記事を読む →

🧠

Zenn3月7日· 1分で読める上級🔥 注目

LLM Paper Reading

LLMの最新研究を6つのテーマで深掘りする無料技術書です。LoRA vs Full Fine-tuning、Tensor Programs V、ドメイン特化スケーリング則、Megatron-LMなど、実装に直結する論文知識を習得できます。東大松尾研発スタートアップによる、医療・製薬LLM開発の現場で必要とされる知見がまとまっています。

#ファインチューニング #LLM #分散学習

記事を読む →

⚡

Zenn3月6日· 2分で読める上級🔥 注目

AWS Trainium/Inferentiaで言語モデルの訓練と推論

AWS TrainiumでQwen3をLoRAファインチューンし、推論サーバーまで構築する実装ガイドです。Optimum-Neuronを使った分散訓練の具体的な手順、チェックポイント統合（consolidate）の非自明な操作、tensorboardでのloss確認まで、実装上の落とし穴を交えて解説しています。オンプレGPUと異なるNeuronコアへの最適化がポイントです。

#AWS Trainium #ファインチューニング #Optimum-Neuron

記事を読む →

🧠

Zenn3月4日· 2分で読める上級🔥 注目

長い会話でLLMの精度は最大33%落ちる——「コンテキスト崩壊」とコーディングエージェントへの影響

Stanford研究が衝撃の結果を発表しました。GPT-5含む最新LLMでも、長い会話では精度が最大33%低下する「コンテキスト崩壊」が発生します。コーディングタスクでも10～20%の精度低下が確認されており、Claude CodeやCodex CLIでの長時間セッションに直結する課題です。パラメータ調整では解決不可能で、セッションリセット＋要約引き継ぎという実践的な対策を、具体的なワークフロー例と共に解説しています。

#LLM #Claude Code #AI駆動開発

記事を読む →

📰

DeepMind10月25日· 2分で読める上級🔥 注目

MedGemma: Our most capable open models for health AI development

Googleが医療AI開発向けのオープンモデル「MedGemma」の新版を発表しました。27B Multimodalは電子カルテの複雑な解釈に対応し、MedSigLIPは医療画像分類・検索用の軽量エンコーダです。単一GPUで動作し、4Bはモバイルにも対応。MedQAで64.4%を達成し、胸部X線レポートの81%が放射線科医の評価基準を満たしています。医療アプリ開発の実装ハードルが大きく下がります。

#医療AI #マルチモーダルモデ #Gemma

記事を読む →

📰

HuggingFace3月11日· 2分で読める上級🔥 注目

Open R1: Update #3

DeepSeek-R1の推論手法をオープンソース化するOpen R1プロジェクトの最新成果です。競技プログラミングに特化した約10万サンプルのCodeForces-CoTsデータセットと、IOI（国際情報オリンピック）ベンチマークを公開しました。これらで訓練したOlympicCoder-32Bモデルは、Claude 3.7 Sonnetなどの閉鎖型frontier モデルを上回り、100倍以上大きなモデルも凌駕しています。実装可能な高品質データセットとベンチマークが揃い、コード推論の民主化が進みます。

#モデル・基盤 #推論最適化 #オープンソース

記事を読む →

【2026年最新】RAG精度改善技術のカオスマップ─ 74の技術を6カテゴリで構造的に整理した

RTX 4080で挑む強化学習コードLLM — 実行フィードバックで1.5Bモデルを鍛える全記録

【実践】Gemma4-31BをQLoRAで日本語エージェントに特化させる手順とベンチマーク

【Claude Code × Colab 第5弾】時系列の次は衛星画像──EuroSATでResNet50が97.8%を出した話

# 青空文庫11冊でLLMをゼロから作ったら、意外と日本語を喋った話

FT-LLM 2026 チーム・ビクトリー 解法 推論パート

ルーブリックに基づく主観的な判定を取り入れたGRPO学習

海外LLMを日本仕様に「再調整」する — Sakana AI Namazuの事後学習技術が開く新しい可能性

「RAGの精度が出ない」を解決する — ドメイン特化型Embeddingモデルを1日でファインチューニングする実践ガイド【2026年春版】

建設現場の人手不足を解決！AIセコカン「Arch Intelligence」で生産性2倍を目指す3つの革新

【第1章】ディズニーのように動くVTuberを、最新AIでリアルタイムに作りたい

松尾研LLMコンペ2025 アドバンスド参戦記 — 100+モデル作って学んだこと

Private LLMを使ってオンプレ版26aiのSELECT AIを外部サービス連携なしで動かしてみた

エッジ型SIEM基盤実装（OSS推進フォーラム）

最適化アルゴリズム（Adam・SGD）って何だろう？

SDG-LOOM — LLMによる大規模合成データ生成フレームワーク

Unslothを活用したLlama-3.1-8BのファインチューニングとGGUF変換・ローカル移行の実践

「松尾研LLM講座2025応用編」アドバンスドコンペの感想をまとめてみた

LLM Paper Reading

AWS Trainium/Inferentiaで言語モデルの訓練と推論

長い会話でLLMの精度は最大33%落ちる——「コンテキスト崩壊」とコーディングエージェントへの影響

MedGemma: Our most capable open models for health AI development

Open R1: Update #3

FT-LLM 2026 チーム・ビクトリー解法推論パート