Zenn· 1分で読める中級🔥 注目
Ollama 0.19がMLXを採用 ─ Apple Siliconのローカル推論はどう変わるか
AI要約
Ollama 0.19がApple Silicon向けの推論バックエンドをllama.cppからMLXに切り替えました。統一メモリ構造をネイティブに活用するMLXにより、デコード性能は約2倍向上します。ただしNVFP4量子化フォーマットの採用が必須で、既存モデルは改善を受けられない点に注意が必要です。M5チップでの追加最適化も解説しています。
AI要約
Ollama 0.19がApple Silicon向けの推論バックエンドをllama.cppからMLXに切り替えました。統一メモリ構造をネイティブに活用するMLXにより、デコード性能は約2倍向上します。ただしNVFP4量子化フォーマットの採用が必須で、既存モデルは改善を受けられない点に注意が必要です。M5チップでの追加最適化も解説しています。