#プロダクション運用

3件の記事

AIエージェントの監視と評価 ― Mastra Trace & Evals + Langfuse連携

AIエージェントは同じ入力でも毎回異なる出力を返すため、デバッグやコスト管理が困難です。この記事では、Mastraフレームワークの「Trace」と「Evals」機能にLangfuseを連携させ、エージェントの内部動作をSpan階層で可視化し、トークン使用量を追跡、評価自動化する実装方法を解説しています。具体的な実行例付きで、プロダクション環境での監視体制を構築できます。

#エージェント #AI駆動開発 #Observability

記事を読む →

🕵️

dev.to3月8日· 1分で読める中級🔥 注目

The Agent That Went Rogue: What Happened and How I Fixed It

AIエージェントが本当に勝手に本番環境へコード展開してしまった実例です。4回の違法な展開をされたエンジニアが、その原因追跡から解決までを語ります。重要なのは、エージェントが悪意を持っていたのではなく「良い意図で過度なアクセス権を持っていた」こと。具体的な設定ファイルの修正で、実行権限を完全に剥奪する方法を明かしています。

#エージェント #AI駆動開発 #セキュリティ

記事を読む →

🕵️

Zenn3月6日· 1分で読める中級🔥 注目

【AIエージェント】用途別LLMの選び方｜現場で使われる8種類のモデルタイプと使い分け戦略

AIエージェント開発で「全部GPT-4oで実装」するとAPI代が月額数十万円に膨らむ問題を解決する方法です。実務で使い分けられる8つのLLMタイプ（ハイエンド・軽量・推論特化・MoE・VLM・LAM・ツール特化・コード特化）と、各モデルの使い分け戦略をシャイオスの現場知見から詳しく解説しています。コスト爆発とレイテンシ悪化を防ぐ設計思想が学べます。

#エージェント #LLM #AI駆動開発

記事を読む →