Zenn2026年4月2日· 1分で読める中級🔥 注目

Ollama 0.19がMLXを採用 ─ Apple Siliconのローカル推論はどう変わるか

AI要約

Ollama 0.19がApple Silicon向けの推論バックエンドをllama.cppからMLXに切り替えました。統一メモリ構造をネイティブに活用するMLXにより、デコード性能は約2倍向上します。ただしNVFP4量子化フォーマットの採用が必須で、既存モデルは改善を受けられない点に注意が必要です。M5チップでの追加最適化も解説しています。

#Apple Silicon #推論最適化 #LLM #MLX #Ollama #量子化

𝕏 ポスト B! はてブ

元記事を読む →

Ollama 0.19がMLXを採用 ─ Apple Siliconのローカル推論はどう変わるか

関連記事

ねこと学ぶ🐱 Apple Silicon で LLM 推論を最適化する Hypura を試す

M5 MacBook Proでローカルにシフトする — LM Studio × llama.cpp × Ollama 実践ベンチマーク 2026年3月版