#品質管理

7件の記事

AIネイティブ時代のQA体制構築とキャリアの再定義

AI生成コードの45%に脆弱性が含まれているのに、76%の開発者が「AIコードは人間より安全」と認識。この認識ギャップがリスクです。本記事は定量データでAI導入の落とし穴を示し、ジュニアエンジニアのキャリア再定義と実践的なQA体制構築を提案します。監査力・設計力を磨き、AI時代に生き残るロール定義が学べます。

#AI駆動開発 #QA #テスト自動化

記事を読む →

⚡

Zenn4月2日· 2分で読める中級🔥 注目

ハーネスエンジニアリングの先へ — VSDD × CoDDで「実装品質」と「変更時の整合性」を両立させてみた

VSDDとCoDDを統合したVCSDDという新手法が、AI駆動開発における「実装品質」と「変更時の整合性」の両立を実現しました。AIスロップ（低品質なコード生成）に敵対的レビューで対抗しつつ、要件変更時の影響範囲を自動追跡できます。React開発でClaudeと組み合わせるプラグインとして実装され、設計書・コード・テスト間の依存関係を記録・管理することで、長期的な保守性を大幅に向上させています。

#Claude Code #AI駆動開発 #ハーネスエンジニアリング

記事を読む →

⚡

Zenn3月30日· 2分で読める中級🔥 注目

AIエージェント組織の工程設計 - 成果物と役割のマッピングで不整合を防ぐ

Claude Codeでマルチエージェント開発していて「programmerが画面設計を書く」など役割の不整合が多発。成果物と必要スキル、エージェント能力を体系的に検証する仕組みを設計段階に組み込み、WBSテンプレートに体制計画セクションを追加しhookで強制。その後、5Why分析でルール追加のバイアスを排除し、問題を設計変更で解決する方法論を確立。実装ノウハウが詰まっています。

#AI駆動開発 #Claude Code #エージェント

記事を読む →

🕵️

Qiita3月21日· 2分で読める中級🔥 注目

State of Agent Engineering 2026完全解説 — 本番導入57%・品質障壁32%の実態

LangChainの大規模調査（1,340名対象）から、AIエージェント本番導入率が57%に到達した実態が明らかになりました。最大の障壁は「品質」（32%）であり、コスト懸念は減少。89%がオブザーバビリティを導入済みですが、評価（Evals）は52%にとどまります。エンタープライズではセキュリティが第2の障壁として浮上。企業規模別・業界別の詳細データから、自社の取り組み状況を客観的に評価できます。

#エージェント #オブザーバビリティ #品質管理

記事を読む →

⚡

Qiita3月21日· 2分で読める中級🔥 注目

Googleが「AI製バグレポート」を拒否した理由とエンジニアの生存戦略

Googleが2026年3月、AI生成バグレポートの受け入れを原則停止した衝撃的決定の背景を解説しています。ハルシネーションと再現性欠如によるノイズ急増で審査リソースが圧迫された結果です。重要な学びは、AI出力を「報告作成マシン」ではなく「検証プロセス補助ツール」として再定義し、再帰的プロンプトでPoC実行と根拠確認を自動化することです。AIの出力を疑い検証する能力こそが、AI時代のエンジニアの生存戦略だと主張しています。

#AI駆動開発 #セキュリティ #LLM

記事を読む →

⚡

Qiita3月9日· 1分で読める中級🔥 注目

テスト観点の壁打ちにAIを活用すると要件整理にもつながる

テスト観点の設計をAIと議論すると、要件の曖昧さが自動的に浮かび上がります。AIが「書かれていないケース」を容赦なく問い返すことで、仕様書の抜け漏れや矛盾が早期に発見でき、要件整理が同時に進みます。仕様→AIに観点出力させる→曖昧箇所を深掘り→要件を明確化→再度テスト観点化、というサイクルで、開発後半の手戻りリスクを大幅に削減できます。

#AI駆動開発 #要件定義 #テスト設計

記事を読む →

⚡

Zenn3月8日· 2分で読める中級🔥 注目

スキルクリエイターにeval自動生成が追加 — Agent Skillsのベンチマークとモデル更新対応が変わる

Claude Codeのスキルエコシステムが50から334件超に急成長する中、モデル更新時の品質劣化を検知する課題が浮上しました。Anthropicが3月3日に発表した新機能は、エンジニアでないスキル作者向けにeval自動生成・並列実行・A/Bテスト・説明文最適化を提供。evals.jsonで期待値を定義するだけでpass rateやtoken usageを測定でき、モデル更新後の品質劣化を数値で捉えられます。ただしCI統合による本格運用には結局エンジニアのサポートが必要という実装上の課題も指摘されています。

#Claude Code #Agent Skills #AI駆動開発

記事を読む →