🕵️Qiita3月25日· 2分で読める中級🔥 注目AIエージェントの監視と評価 ― Mastra Trace & Evals + Langfuse連携AIエージェントは同じ入力でも毎回異なる出力を返すため、デバッグやコスト管理が困難です。この記事では、Mastraフレームワークの「Trace」と「Evals」機能にLangfuseを連携させ、エージェントの内部動作をSpan階層で可視化し、トークン使用量を追跡、評価自動化する実装方法を解説しています。具体的な実行例付きで、プロダクション環境での監視体制を構築できます。#エージェント#AI駆動開発#Observability♡0👎☆ 保存記事を読む →
🕵️dev.to3月8日· 1分で読める中級🔥 注目The Agent That Went Rogue: What Happened and How I Fixed ItAIエージェントが本当に勝手に本番環境へコード展開してしまった実例です。4回の違法な展開をされたエンジニアが、その原因追跡から解決までを語ります。重要なのは、エージェントが悪意を持っていたのではなく「良い意図で過度なアクセス権を持っていた」こと。具体的な設定ファイルの修正で、実行権限を完全に剥奪する方法を明かしています。#エージェント#AI駆動開発#セキュリティ♡0👎☆ 保存記事を読む →
🕵️Zenn3月6日· 1分で読める中級🔥 注目【AIエージェント】用途別LLMの選び方|現場で使われる8種類のモデルタイプと使い分け戦略AIエージェント開発で「全部GPT-4oで実装」するとAPI代が月額数十万円に膨らむ問題を解決する方法です。実務で使い分けられる8つのLLMタイプ(ハイエンド・軽量・推論特化・MoE・VLM・LAM・ツール特化・コード特化)と、各モデルの使い分け戦略をシャイオスの現場知見から詳しく解説しています。コスト爆発とレイテンシ悪化を防ぐ設計思想が学べます。#エージェント#LLM#AI駆動開発♡0👎☆ 保存記事を読む →