⚡Zenn3月18日· 1分で読める中級🔥 注目QA自動化で学ぶ LLM as a Judge — 「操作するAI」と「判定するAI」を分ける理由QA自動化でLLMが自ら操作と判定を行うと確証バイアスで甘い判定になるという課題を発見。テスト実行エージェント(qa-runner)と判定エージェント(qa-judge)を分離することで、期待結果の情報を一方に与えないクリーンなコンテキストを実現。この「LLM as a Judge」パターンはコードレビューやコンテンツ評価にも応用可能な実装パターンです。#AI駆動開発#エージェント#LLM as a Judge♡0👎☆ 保存記事を読む →
⚡Zenn3月9日· 1分で読める中級🔥 注目AIにCSSを書かせても設計が崩れにくい仕組みの作り方AIにCSSを書かせると、見た目は完璧でも設計が壊れやすい問題があります。この記事は、FLOCSSとmFLOCSSという2つの設計手法を3パターン実装して比較。mFLOCSSでは@layerとデザイントークンでブラウザレベルで優先順位を強制し、AIの判断ブレを減らし、詳細度衝突を根本から防ぐ仕組みを実現しています。実装例を手に取って確認できます。#AI駆動開発#CSS設計#mFLOCCS♡0👎☆ 保存記事を読む →
⚡Qiita3月7日· 1分で読める中級AIのために作ったフレームワークで、Sessionクラスの設計に迷ったからSymfonyを何となくパクってみたというお話AIフレンドリーなフレームワークを作るうえで、Sessionクラスの設計にSymfonyのパターンを参考にした実装例です。Bagパターンで永続データと揮発データを分離し、抽象化は最小限に留めることで、AIが理解しやすくバグを出さないコード設計を実現しています。フレームワーク自作やAI駆動開発の実践的な工夫が学べます。#AI駆動開発#Claude#フレームワーク自作♡0👎☆ 保存記事を読む →