30件の記事
autoresearchやRalph Loopなど注目を集めるAIエージェント系ツールの違いが分からない——そんな疑問に答える俯瞰的整理記事です。約220件の論文とOSSを調査した著者が、Agent Loopを「逐次実行型」「仮説検証型」「自己進化型」の3グループ、7つの型に分類。線形ReAct・Event Stream・木探索・制約付き実験など、各型の使い分けを代表プロジェクトとともに解説しています。実装レベルで何が違うのか、どの場面で何を選ぶべきか?が明確に理解できます。
Clean ArchitectureとDIはエンジニアには最適でも、AIコーディングツールには相性が悪いという矛盾を「Navigation Paradox」と定式化した記事です。DI コンテナがビジネス語彙を失うため、LLMのRAG検索から漏れてコンテキスト断片化が起きます。EMNLP 2024の研究では、モジュール化コードはLLMの成功率が10~14ポイント低下。DI廃棄ではなく「外部インフラ境界のみに限定する」使い分けと、AGENTS.mdによるコンテキスト明示という実践的な対策を提案しています。
Google が Apache 2.0 ライセンスでリリースした Gemma 4 は、テキスト・画像・音声・動画対応のマルチモーダルモデルです。Gemini 3 の技術をベースに、Gemma 3 から数学で 20.8% → 89.2%、コーディングで 29.1% → 77.1% と圧倒的な性能向上を実現。Ollama・HuggingFace Transformers での動かし方から Function Calling まで、ハンズオンで習得できる実践的なガイドです。