Raspberry Pi Zero WでGPT-2を動かした
AI要約
Raspberry Pi Zero W(512MBメモリ)でGPT-2を動かしました。llama.zeroというllama.cppの軽量版を使い、OS準備からモデルダウンロード、実行までの全手順を公開しています。生成速度は0.3~0.4トークン/秒と遅く実用的ではないですが、メモリ制約が厳しいエッジデバイスでLLMを動かす際の実装ノウハウが詰まっています。
AI要約
Raspberry Pi Zero W(512MBメモリ)でGPT-2を動かしました。llama.zeroというllama.cppの軽量版を使い、OS準備からモデルダウンロード、実行までの全手順を公開しています。生成速度は0.3~0.4トークン/秒と遅く実用的ではないですが、メモリ制約が厳しいエッジデバイスでLLMを動かす際の実装ノウハウが詰まっています。
AIをただの「何でもやる1人のエンジニア」として使うから上手くいきません。実際のチーム開発と同じように、PM(要件整理)→エンジニア(実装)→レビュアー(品質チェック)の3役に分けてAIに頼むと、仕様のブレや手戻りが劇的に減ります。各工程のプロンプト例付きで、明日から実践できる運用ノウハウです。

