RTX 4060 8GBでQwen3.5を3本勝負させた — スペック表が教えてくれない選択基準の話
AI要約
RTX 4060 8GBでQwen3.5の3モデル(9B・27B・35B-A3B)を実際に動かし、スペック表では見えない実装知見を暴露します。同じVRAM使用量でも速度が10倍違う理由、MoEなぜGPU利用率が高いのか、thinking tokenがctx枯渇を招く罠——ローカルLLM運用の現実が詰まった検証記です。
AI要約
RTX 4060 8GBでQwen3.5の3モデル(9B・27B・35B-A3B)を実際に動かし、スペック表では見えない実装知見を暴露します。同じVRAM使用量でも速度が10倍違う理由、MoEなぜGPU利用率が高いのか、thinking tokenがctx枯渇を招く罠——ローカルLLM運用の現実が詰まった検証記です。

