Qiita· 2分で読める上級🔥 注目
AgentRx入門 — AIエージェントの障害を体系的に診断するMicrosoft発OSSフレームワーク
AIエージェントの本番運用で頻発する原因特定の難しさを解決するMicrosoft ResearchのOSSフレームワーク「AgentRx」を解説します。4段階診断パイプライン(軌跡正規化→制約合成→ガード付き評価→LLM判定)で、9カテゴリの障害分類体系に基づいて根本原因を自動特定。既存手法比で特定精度+23.6%、根本原因帰属+22.9%の改善を実現。115の失敗軌跡ベンチマークとコードがOSS公開され、実装例も完備されています。