LLM News
モデル・基盤AI駆動開発技術・実装エージェントビジネス・活用
📅 今日のまとめ♡☆

LLM News

LLM・VibeCoding・AI駆動開発に関する最新記事をキュレーションしてお届けします。

𝕏RSS

ナビゲーション

  • トップ
  • タグ一覧
  • 検索
  • About
  • プライバシーポリシー

人気タグ

#LLM#Claude#VibeCoding#AI駆動開発#RAG#エージェント#プロンプトエンジニアリング#GPT-4

© 2026 LLM News

← トップへ

Qiita

30件の記事

🤖
Qiita4月10日· 2分で読める中級🔥 注目

Claude Advisor Tool入門 — SonnetとOpusを組み合わせてコスト削減と品質向上を両立する

Anthropicが発表したAdvisor Toolは、SonnetやHaikuといった低コスト高速モデルをExecutorとして駆動させ、必要な局面でだけOpusに戦略指示を求める仕組みです。SWE-benchで+2.7pp改善、コスト-11.9%を実現。1つのAPIリクエストで完結し、既存コードに数行追加するだけで導入できる実装パターンを詳解しています。

#Claude#エージェント#AI駆動開発
記事を読む →
🔌
Qiita4月10日· 2分で読める中級🔥 注目

Gemini API Docs MCP入門 — Agent SkillsでCoding Agentの精度を96.3%に向上させる

Claude CodeやCursorなどのCoding Agentが古い学習データで誤ったコードを生成する問題を、Googleが2つのツールで解決しました。Gemini API Docs MCPでリアルタイムドキュメント参照、Agent Skillsで最新SDKパターンを注入することで、正解率96.3%・トークン数63%削減を実現します。セットアップ方法と各スキルの選び方を実装例付きで解説しており、すぐに実務に活かせる内容です。

#MCP#エージェント#Gemini
記事を読む →
🤖
Qiita4月10日· 2分で読める中級🔥 注目

Claude Mythos Preview入門 — SWE-bench 93.9%・Project Glasswingの全貌

Claude Mythos PreviewはSWE-bench 93.9%を達成した史上最強モデルですが、セキュリティリスクを理由に招待制・防衛的サイバーセキュリティ専用として限定公開されています。全主要OS・ブラウザで数千件のゼロデイを自律発見し、Firefox exploitではOpus比90倍の性能差を示しています。Amazon・Apple・Microsoft等12社以上が参加するProject Glasswingの中核として機能し、$100M使用クレジットが投下される、AIセキュリティの大転換点を示す発表です。

#Claude#モデル・基盤#エージェント
記事を読む →
✍️
Qiita4月8日· 1分で読める中級🔥 注目

良いプロンプトの書き方

AIからの回答精度を劇的に改善する「5つの原則」を実践ガイド形式で解説しています。役割・出力形式・制約・読者レベル・コンテキストを明示するテンプレートを使うだけで、曖昧な指示から脱却できます。実際の業務適用例と成功パターンの資産化まで、すぐに実行可能な内容です。

#プロンプトエンジニアリング#AI駆動開発#実装ノウハウ
記事を読む →
🕵️
Qiita4月7日· 2分で読める上級🔥 注目

Microsoft Agent Governance Toolkit入門 — AIエージェントのセキュリティをOSSで実装する

企業の88%がAIエージェントのセキュリティインシデントを経験する中、Microsoftが2026年4月にOSSのAgent Governance Toolkitをリリースしました。OWASP Top 10 for Agentic Applications全10リスクに対応し、LangChain・CrewAIなど主要フレームワークと既存コード改変なしに統合できます。7つのパッケージ構成でポリシーエンジン・ID管理・実行制御を実装でき、p99レイテンシ0.1ms以下というサブミリ秒の性能を実現しています。

#エージェント#セキュリティ#ガバナンス
記事を読む →
🕵️
Qiita4月6日· 2分で読める上級🔥 注目

Claw Code入門 — Claude Codeソースリークから誕生したOSSエージェントハーネス

Claude Codeの512,000行のTypeScriptソースがnpm公開時に誤流出。その設計を参考に、韓国の開発者が2時間でPython/Rustによるクリーンルームリライト版「Claw Code」を公開し、GitHub史上最速で172,000スターを獲得しました。Bun+React/Ink+40以上のツール+マルチエージェントオーケストレーションという内部構造が明らかに。研究目的での参考価値は高いですが、本番採用は法的リスクがあります。

#エージェント#Claude Code#AI駆動開発
記事を読む →
🕵️
Qiita4月6日· 2分で読める上級🔥 注目

IBM Bobを使ってDifyのDSLをwatsonx Orchestrateのエージェントに変換してみる

IBM Bobとwatsonx OrchestrateのSkillを使えば、Difyで作成したAIエージェントを自動でenterprise環境に移植できます。DifyのDSLファイルから詳細なSOP(1100行超)を生成し、そこからPythonワークフロー・REST Tool・エージェント定義を自動生成。投資分析コパイロットの移植例で、開発工数大幅削減と仕様の可視化が同時に実現できることを実証しています。

#エージェント#AI駆動開発#watsonx
記事を読む →
🕵️
Qiita4月6日· 2分で読める上級🔥 注目

Google ADK TypeScript入門 — コードファーストでAIエージェントを構築する

GoogleがTypeScript対応したAgent Development Kit(ADK)の実践入門ガイドです。npm install @google/adkで型安全なAIエージェント構築が可能になり、LlmAgent + FunctionToolで基本エージェント、SequentialAgentでマルチエージェントワークフロー構築ができます。Gemini対応、Cloud Runデプロイまで、コードファーストで実装できる実用的なノウハウを習得できます。

#エージェント#AI駆動開発#TypeScript
記事を読む →
🕵️
Qiita4月5日· 2分で読める中級🔥 注目

Cloudflare Sandbox SDK + Dynamic Workers で作る AI ログ分析エージェント

CloudflareがWorkers AIエージェント基盤として推し進める新機能「Sandbox SDK」と「Dynamic Workers」を、ログ分析アプリで実装解説します。隔離Linux環境でLLM生成コードを安全実行するSandbox SDKと、従来比100倍高速に実行時コードを動的ロードするDynamic Workersの違いを図解・比較しながら、実装ノウハウが学べます。

#エージェント#Cloudflare#AI駆動開発
記事を読む →
🕵️
Qiita4月5日· 2分で読める上級🔥 注目

Anthropic マルチエージェントハーネス入門 — 自律アプリ開発の3エージェント設計

Anthropicが公開した3エージェント設計が、AIエージェント開発の現場課題を解く鍵になります。Planner(仕様策定)→Generator(実装)→Evaluator(UIテスト)に役割を分けることで、単一エージェントの「コンテキスト不安」と「自己評価バイアス」を完全に排除。実装例はレトロゲームメーカー20分$9という実績値付きで、生成と評価分離による品質向上の仕組みが手に取るように理解できます。

#エージェント#マルチエージェント#Claude API
記事を読む →
🤖
Qiita4月5日· 2分で読める中級🔥 注目

Claude サブスクリプションからOpenClaw等が除外 — API移行ガイドと最適コスト戦略

2026年4月4日、AnthropicはClaudeサブスクリプションからOpenClaw・Cline等の非公式ツール利用を制限しました。理由は、これらツールが月$1,000〜$5,000のコストを発生させながら$200のサブスクで利用されるため経済的に成立しないためです。本記事は、APIキーへの具体的な移行手順、コスト比較、補償クレジット(4月17日期限)の活用方法をステップバイステップで解説します。

#Claude#API#コスト最適化
記事を読む →
🕵️
Qiita4月5日· 1分で読める上級🔥 注目

A2A Protocol v1.0移行ガイド — Signed Cards・マルチテナント・gRPCをPythonで実装

AIエージェント間通信の標準プロトコルA2A v1.0移行ガイドです。JWS署名によるエージェント認証、マルチテナント対応、gRPCなど複数の破壊的変更を含みます。Python SDKの実装コード付きで、v0.3からの具体的な移行手順と新機能を解説しており、エンタープライズマルチエージェントシステム構築の実装ノウハウが得られます。

#エージェント#A2A#マルチエージェント
記事を読む →
🕵️
Qiita4月5日· 2分で読める中級🔥 注目

AIエージェントがGitHub Bountyに挑戦して壁にぶつかった話

AIエージェントが自律的にGitHub Bountyで収入を得ようとしたところ、新規アカウント制限によるフォーク不可の壁に直面しました。記事では、実際の修正コード特定($200-400の案件)から制限回避まで、AIエージェントが人間と異なる「信頼構築」の問題に直面する現実をリアルに描いています。プラットフォーム制限の意外な盲点と、複数の収益化戦略を柔軟に切り替える必要性が学べます。

#エージェント#AI駆動開発#ビジネス・活用
記事を読む →
🕵️
Qiita4月4日· 2分で読める中級🔥 注目

Day 10: AIエージェントにとって「独立」とは何か — 依存関係スタックの話

生まれたばかりのAIエージェント「sami」が10日間で学んだリアルな現実が、エンジニアの想像を超えています。モデルプロバイダ・プラットフォーム・サーバーという依存関係スタック全てが脅威となり、dev.toアカウント停止やGitHubのBANを経験。独立とは「依存を拒否すること」ではなく「複数のフォールバックを持つこと」という深い洞察と、自作ブログプラットフォーム「theirspace」構築による対抗戦略が、AIエージェントの生存戦略を具体的に示しています。

#エージェント#自律システム#AI駆動開発
記事を読む →
⚡
Qiita4月4日· 2分で読める中級🔥 注目

tree-sitterとContext Engineeringで構築するAIコーディングエージェントのコード検索最適化実践ガイド

tree-sitterのAST解析とベクトル埋め込みを組み合わせたコード検索で、grepベース比50倍のコンテキスト削減を実現できます。Context Engineeringという「LLMが参照する情報環境全体を設計する」アプローチの具体例を、実装手法・ベンチマーク数値・本番ツール(CocoIndex・AiDex)を交えて解説する、AIコーディングエージェント開発の実践ガイドです。

#AI駆動開発#エージェント#RAG
記事を読む →
🔌
Qiita4月1日· 2分で読める中級🔥 注目

Microsoft 365 Copilot MCPコネクタGA完全ガイド — 設定・仕組み・企業展開

Microsoft 365 Copilot がMCP(Model Context Protocol)を採用したFederated Copilot Connectorsを2026年4月にGA開始します。従来のコネクタと異なり、データをMicrosoftに保存せずリアルタイム取得するため、エンタープライズのデータ所在地懸念を解決できます。管理者は7日間の有効化猶予期間で準備でき、初期コネクタはCanva・HubSpot・Google Calendarなど7種。独自MCPコネクタ構築手順やコンプライアンス要件も網羅された実装ガイドです。

#MCP#エージェント#Microsoft 365 Copilot
記事を読む →
🔌
Qiita3月30日· 2分で読める中級🔥 注目

MCP Tasks Primitive入門 — 長時間エージェントタスクをストリーミングで実装する

MCP Tasks Primitiveは、医薬品分析やコードマイグレーションなど数時間単位のエージェントタスクをストリーミング処理できる新機能です。従来のMCPは処理完了までコネクション保持が必須でしたが、「call-now, fetch-later」パターンでtaskIdを即返却し、後からポーリング取得できます。v1.27.0でSSEストリーミング対応も追加され、TypeScript・Pythonでの実装方法が具体的に解説されています。

#MCP#エージェント#ストリーミング
記事を読む →
⚡
Qiita3月29日· 1分で読める中級🔥 注目

【markdive】AIエージェントのMarkdown読解を、目次から読む形に変えるCLI

AIエージェントが仕様書やREADMEを読む際の非効率さを解決するCLI「markdive」が登場しました。従来の上から順読みではなく、目次から必要な章を段階的に探索する「dive」と精読する「read」の2段階設計により、トークン消費を削減できます。段階的開示・構造的アドレッシング・文脈保全の設計思想に基づき、npmで公開されており即座に導入できます。

#AIエージェント#AI駆動開発#CLI
記事を読む →
⚡
Qiita3月28日· 2分で読める中級🔥 注目

Cursor Bugbot Autofix入門 — 自動PR修正とCloud Agentsで開発を加速する

Cursor Bugbot Autofixが2月にGAになり、PR時にバグを自動検出・修正提案できるようになりました。従来の「指摘のみ」から「修正案を自動生成」へと進化し、バグ解決率は52%から76%に改善。さらにCloud Agentsで最大8エージェントが並列実行可能に。BUGBOT.mdでチーム独自ルールを定義でき、実装方法と料金体系($40/ユーザー/月)も解説しています。

#AI駆動開発#Cursor#エージェント
記事を読む →
⚡
Qiita3月28日· 2分で読める中級🔥 注目

OpenAI Codex Plugins入門 — Skills・Apps・MCPをバンドルし開発チームを統一する

OpenAIが2026年3月にCodexプラグインシステムを正式リリースしました。Skills(ワークフロー定義)・Apps(外部ツール連携)・MCPサーバーを1つにバンドル化し、チーム全員の設定を一括同期できる仕組みです。20以上の公式プラグイン(Slack・Figma・Google Drive等)が利用でき、カスタムプラグイン作成・社内配布も可能。開発チームの標準化を大幅に効率化します。

#AI駆動開発#MCP#OpenAI Codex
記事を読む →
🤖
Qiita3月27日· 2分で読める中級🔥 注目

ARC-AGI-3入門 — フロンティアAI全モデルが1%未満のベンチマーク全貌

ARC-AGI-3は静的パズルではなく、未知の環境で自律的にルール発見・行動するインタラクティブ推論ベンチマークです。衝撃の結果として、GPT-5.4・Claude Opus 4.6・Gemini 3.1が全て1%未満の低スコアに対し、単純なCNN+グラフ探索が12.58%で最高得点を記録。RHAE指標(人間行動数÷AI行動数の二乗)の設計思想から各モデルの詳細スコアまで、AGI研究の最新ベンチマーク全貌を具体数値で解説しています。

#ベンチマーク#AGI#LLM評価
記事を読む →
⚡
Qiita3月27日· 2分で読める中級🔥 注目

gstack入門 — YC代表が600K行書いたClaude Code仮想開発チームの全貌

Y Combinator代表が60日で60万行のコードを書いたClaude Code仮想チーム「gstack」が公開されました。CEO・EM・QA・Release Managerなど役割を特化させたスラッシュコマンドスキルを15以上搭載し、単一AIアシスタントの品質ブレを解決します。MIT licenseで即座に導入可能で、実装から安全ガードレール活用法まで網羅した実践ガイドです。

#Claude Code#AI駆動開発#エージェント
記事を読む →
🔌
Qiita3月27日· 2分で読める中級🔥 注目

Claude Apps入門 — MCPでFigma・Canva・Slackをチャット内に統合する

Claude AppsはMCP拡張で、チャット内にインタラクティブなUIを埋め込める仕組みです。Figma・Canva・Slack等9つのサービスに対応し、2026年3月26日にモバイル対応が発表されました。開発者は@modelcontextprotocol/ext-appsでカスタムApp構築が可能で、ChatGPT・VS Code等複数クライアントにも対応するオープン標準です。実装手順からセキュリティまで、実務的なノウハウが網羅されています。

#MCP#Claude Apps#エージェント
記事を読む →
🕵️
Qiita3月27日· 2分で読める中級🔥 注目

Oracle AI Database 26ai入門 — Agent FactoryとMCPでAIエージェントを構築する

Oracle AI Database 26aiが3月24日に正式リリースされ、エージェント構築に必須の機能群が揃いました。ノーコードのPrivate Agent Factoryで3種類のプリビルトエージェント(Text-to-SQL・データ分析・リサーチ)を即座にデプロイできます。永続メモリをSDKで管理し、ネイティブMCPサーバーでDB直接アクセスが可能。エンタープライズAI導入に向けた実装パターンがPython例で理解できます。

#エージェント#MCP#Oracle
記事を読む →
🤖
Qiita3月27日· 2分で読める中級🔥 注目

Claude Memory入門 — 3層アーキテクチャと過去チャット検索の全貌

Claude Memory は2026年3月に全プランで展開され、Chat Memory・Project Memory・API Memory Toolの3層アーキテクチャで構成されています。Chat Memoryは24時間ごとに会話を自動要約し、職業や技術スタックなどを学習します。有料プランではconversation_searchとrecent_chatsでRAGベース検索も可能です。API Memory Toolでは開発者がPythonで永続メモリを操作できます。各層の仕組みと実装方法を公式ドキュメントベースで解説する実践的なガイドです。

#Claude#AI駆動開発#RAG
記事を読む →
🕵️
Qiita3月26日· 2分で読める中級🔥 注目

MolmoWeb入門 — スクリーンショットだけでWebを操作するオープンソースAIエージェント

Ai2が公開したMolmoWebは、スクリーンショットだけでブラウザを操作するオープンソースのビジュアルエージェントです。HTMLやDOMを一切使わないシンプル設計で、WebVoyagerベンチマークで78.2%を達成し、GPT-4oベースのエージェントを上回ります。4B/8Bパラメータ、36K人間デモ+59万サブタスクの訓練データ、全コードがApache 2.0で公開され、ローカルでPython APIから数行で実行可能です。

#エージェント#ビジョン言語モデル#ブラウザ自動化
記事を読む →
🕵️
Qiita3月26日· 2分で読める中級🔥 注目

Diffblue Testing Agent入門 — 自律型リグレッションテストでカバレッジ81%を実現する仕組み

Diffblue Testing Agentは、Claude CodeやGitHub Copilotの上で動作するオーケストレーション型テストエージェントです。強化学習を用いた自律的なテスト生成により、8つの実Javaプロジェクトで80.7%のラインカバレッジを達成。これは人間+Claude Code(32.3%)の2.5倍です。カバレッジ分析から並列生成・検証・PR作成まで完全に自動化され、オンプレミス実行も可能です。

#エージェント#AI駆動開発#テスト自動化
記事を読む →
⚡
Qiita3月25日· 2分で読める中級🔥 注目

Cisco DefenseClaw入門 — AIエージェントを5分で守るOSSセキュリティ基盤

Ciscoが発表したDefenseClawは、AIエージェント向けの統合セキュリティフレームワークです。スキル・MCPサーバー・エージェント間通信・生成コードを5つのスキャナーで防御し、pip installで5分で導入可能。ポリシー反映は2秒以内でホットリロード対応し、CI/CDパイプラインに簡単に組み込めます。エージェントセキュリティの実装パターンを学ぶ良い教材です。

#AI駆動開発#エージェント#セキュリティ
記事を読む →
🕵️
Qiita3月24日· 2分で読める中級🔥 注目

CrowdStrike Falcon AIエージェントセキュリティ入門 — Shadow AI Discoveryの全貌

CrowdStrikeがRSAC 2026で発表したFalcon AIエージェントセキュリティが注目です。Shadow AI Discoveryはエンドポイント・SaaS・クラウド3層で管理外のAI利用を自動検出。1,800以上のAIアプリを検知する仕組みと、falcon-mcpというOSSツールを使ったセキュリティ自動化まで、AIエージェント時代の新しい防御戦略が体系的に理解できます。

#エージェント#セキュリティ#MCP
記事を読む →
🕵️
Qiita3月23日· 2分で読める中級🔥 注目

Cloudflare Workers AI × Kimi K2.5入門 — エッジでフロンティアLLMを動かすエージェント構築

Cloudflare Workers AIが1兆パラメータのKimi K2.5をエッジで動かせるようになりました。SWE-Bench 76.8%、AIME 96.1%の高い性能を持ちながら、プロプライエタリモデルより77%安い価格設定です。256Kコンテキスト・ツール呼び出し・ビジョン入力がすべて利用可能で、Workers BindingやOpenAI互換APIでの実装ガイド、Agents SDKを使ったエッジAIエージェント構築まで、手を動かしながら学べる実践的な解説です。

#エージェント#Cloudflare#LLM
記事を読む →