Zenn· 2分で読める中級🔥 注目
自宅GPUクラスタ(GB10×3)でQwen3.5-397BをClaude Codeのサブエージェント化
自宅のGB10 GPU×3台を200GbE で接続し、Qwen3.5-397B(397Bパラメータ)をClaude Codeのサブエージェント化する実装に成功しました。llama.cppの分散推論で11tokens/sを実現し、API課金削減と「超巨大モデルを手元で動かす」という開発者のロマンを両立。ネットワーク構成から起動手順まで、実用運用に至る全てのノウハウが共有されています。