Qiita· 2分で読める中級🔥 注目
メモリ帯域49倍差、ローカルLLMの物理的限界
ローカルLLM推論の真の制約はGPU演算力ではなく、メモリ帯域だと明かします。RTX 4060の272 GB/sに対し、2026年のHBM4搭載GPUは約22 TB/sへ達する予定。データセンターGPUとコンシューマGPUの帯域格差は2022年の5.6倍から2026年には約49倍に拡大。物理的なアーキテクチャの違い(HBMの垂直積層 vs GDDR6/7のPCB接続)により、この構造的格差は縮まらない可能性が高いです。