Opus vs Sonnet ── AIの「安い方」でコード書かせたら、たった1テスト差だった件

Qiita4月10日· 1分で読める中級🔥 注目

「SaaS死す」再燃――Anthropic Mythosが照らし出すソフトウェア業界の断層線

Qiita4月10日· 2分で読める中級🔥 注目

Claude Advisor Tool入門 — SonnetとOpusを組み合わせてコスト削減と品質向上を両立する

Anthropicが発表したAdvisor Toolは、SonnetやHaikuといった低コスト高速モデルをExecutorとして駆動させ、必要な局面でだけOpusに戦略指示を求める仕組みです。SWE-benchで+2.7pp改善、コスト-11.9%を実現。1つのAPIリクエストで完結し、既存コードに数行追加するだけで導入できる実装パターンを詳解しています。

#Claude #エージェント #AI駆動開発

記事を読む →

Zenn4月10日· 2分で読める中級🔥 注目

実践プロンプトエンジニアリング：評価駆動で本番LLMアプリのプロンプトを継続改善する

プロンプトエンジニアリングは「指示文の工夫」から「コンテキスト環境の設計」へ進化しています。本記事は、Promptfoo・Braintrustを用いた評価駆動のプロンプト開発サイクルを実装する方法を解説します。コンテキストの3層構造（指示・知識・ツール）の設計パターンから、CI/CD統合、A/Bテスト、本番運用までの一貫したワークフローを、実装コード付きで学べます。評価ループ自動化により開発効率が約50%向上する事例も紹介されています。

#プロンプトエンジニアリング #コンテキストエンジニアリング #AI駆動開発

記事を読む →

Qiita4月10日· 2分で読める中級🔥 注目

Claudeの概要と設計思想から学んだこと

ClaudeのDesktop、Chrome拡張、Cowork、Codeの4つのツールと、Code強化の5つの機能（Rules・Skills・Commands・Agents・Hooks）について、設計思想とともに解説しています。Rules、Skills等の具体的な運用例を示しており、実在システムでの規模感（Agents119個など）から、企業レベルのプロジェクトでの本気の活用方法が学べます。

#Claude #Claude Code #AI駆動開発

記事を読む →

Opus vs Sonnet ── AIの「安い方」でコード書かせたら、たった1テスト差だった件

関連記事

「SaaS死す」再燃――Anthropic Mythosが照らし出すソフトウェア業界の断層線

Claude Advisor Tool入門 — SonnetとOpusを組み合わせてコスト削減と品質向上を両立する

実践プロンプトエンジニアリング：評価駆動で本番LLMアプリのプロンプトを継続改善する

Claudeの概要と設計思想から学んだこと