Opus vs Sonnet ── AIの「安い方」でコード書かせたら、たった1テスト差だった件
AI要約
ClaudeのOpus 4.6とSonnet 4.6でコード生成能力を比較した実験結果です。4言語×5回の同一条件で総合スコアは133対132と僅差でしたが、失敗パターンが異なります。Opusは致命的な1回の大失敗、Sonnetは小さなバグが毎回散在。ビルド失敗は即座に気づけますが、テスト7項目中6項目が通るバグは見逃しやすく、実務ではSonnetの方が怖いという実践的な知見が得られます。



