Zenn2026年4月1日· 1分で読める中級🔥 注目

RTX5070Ti + Ollama で動くローカル LLM で一番賢いのはどれだ？！実際に比較検証してみました

AI要約

RTX5070Tiで動作するローカルLLMを10種類ベンチマーク検証した記事です。VRAM16GBまで収まるgpt-oss:20bが速度と精度のバランスが最良で、Qwenは推論性能に優れ、larger modelはRAMオフロードで著しく速度低下することを実測データで実証しています。ローカルLLM導入時の機種選定に直結する具体値が豊富です。

#ローカルLLM #Ollama #ベンチマーク #GPU最適化 #実装検証 #RTX5070Ti

𝕏 ポスト B! はてブ

元記事を読む →

Zenn4月7日· 2分で読める中級🔥 注目

Gemma 4がローカルLLMの実務投入で頭ひとつ抜けていた話

Gemma 4がローカルLLMの実務投入で真価を発揮します。株価予測タスク（500件の開示から方向を推定）でQwen 3.5に対し精度88% vs 71%、空振り4件 vs 19件と圧倒的に上回りました。特にMoE版（26b）は精度を損なわずVRAM 17GBで最速（0.8秒応答）を実現。「定型的な情報」と「実質的な材料」を区別できる能力が、実務投入で決定的に効きます。

#LLM #Gemma #ローカルLLM

RTX5070Ti + Ollama で動くローカル LLM で一番賢いのはどれだ？！実際に比較検証してみました

関連記事

Gemma 4がローカルLLMの実務投入で頭ひとつ抜けていた話

mesh-llm：余っているPCのGPUを束ねて巨大LLMを動かす分散推論の新アプローチ

【Ollama】ローカルLLMでRAGを実装して遊んでみた

【2026年版】AWSで社内ローカルLLMを構築する完全ガイド──データを外に出さない「自社AI」のつくり方