🕵️Zenn3月24日· 1分で読める中級🔥 注目エージェントが「手動テスター」になれる理由エージェントがUIを操作してテストする「Agentic manual testing」が現実になりました。ブラウザ操作・エラー検証・入力パターン試行などの定量的テストはエージェントが自動化できますが、感覚的な評価はまだ人間の領域です。繰り返し作業から人間が解放され、ビジネス判断に集中できるようになる可能性を、実装的視点から解説しています。#エージェント#QA自動化#AI駆動開発♡0👎☆ 保存記事を読む →
⚡Zenn3月18日· 1分で読める中級🔥 注目QA自動化で学ぶ LLM as a Judge — 「操作するAI」と「判定するAI」を分ける理由QA自動化でLLMが自ら操作と判定を行うと確証バイアスで甘い判定になるという課題を発見。テスト実行エージェント(qa-runner)と判定エージェント(qa-judge)を分離することで、期待結果の情報を一方に与えないクリーンなコンテキストを実現。この「LLM as a Judge」パターンはコードレビューやコンテンツ評価にも応用可能な実装パターンです。#AI駆動開発#エージェント#LLM as a Judge♡0👎☆ 保存記事を読む →