#Gemma

6件の記事

Gemma 4がローカルLLMの実務投入で頭ひとつ抜けていた話

Gemma 4がローカルLLMの実務投入で真価を発揮します。株価予測タスク（500件の開示から方向を推定）でQwen 3.5に対し精度88% vs 71%、空振り4件 vs 19件と圧倒的に上回りました。特にMoE版（26b）は精度を損なわずVRAM 17GBで最速（0.8秒応答）を実現。「定型的な情報」と「実質的な材料」を区別できる能力が、実務投入で決定的に効きます。

#LLM #Gemma #ローカルLLM

記事を読む →

📰

Zenn4月7日· 2分で読める中級

Googleが「Gemma 4」と「Veo 3.1 Lite」を公開——「エッジAI」って何？スマホの中でAIが動く時代が来た

GoogleがGemma 4とVeo 3.1 Liteを公開し、エッジAI時代の到来を示しました。エッジAIはスマホやデバイス内でAIが動く技術で、クラウド不要・データ送信不要・低遅延・低コストが特徴です。Gemma 4は数十億パラメータの軽量モデル、Veo 3.1 Liteは動画生成の軽量版。これにより中小企業や医療・金融など機密情報を扱う業界でも安全かつ安価にAIが使える環境が整います。

#エッジAI #Gemma #Google

記事を読む →

🧠

Qiita4月4日· 2分で読める上級🔥 注目

【実践】Gemma4-31BをQLoRAで日本語エージェントに特化させる手順とベンチマーク

Gemma4-31BをQLoRAで日本語エージェントに特化させた実装レポートです。ClippableLinearやmm_token_type_idsといったGemma4特有のハマりポイント解決法を公開。1,546サンプルでファインチューニングした結果、Function Calling・Multi-step ReActで+2.0の性能向上を達成。Claude Codeのトークン消費削減を目指すローカルサブエージェント構築の実践的なノウハウが詰まっています。

#LLM #QLoRA #ファインチューニング

記事を読む →

🧠

Zenn4月3日· 2分で読める中級🔥 注目

Google Gemma 4 実践ガイド — Ollama・HuggingFace で動かすマルチモーダル対応オープンモデル

Google が Apache 2.0 ライセンスでリリースした Gemma 4 は、テキスト・画像・音声・動画対応のマルチモーダルモデルです。Gemini 3 の技術をベースに、Gemma 3 から数学で 20.8% → 89.2%、コーディングで 29.1% → 77.1% と圧倒的な性能向上を実現。Ollama・HuggingFace Transformers での動かし方から Function Calling まで、ハンズオンで習得できる実践的なガイドです。

#Gemma #LLM #モデル・基盤

記事を読む →

📰

DeepMind10月25日· 2分で読める上級🔥 注目

MedGemma: Our most capable open models for health AI development

Googleが医療AI開発向けのオープンモデル「MedGemma」の新版を発表しました。27B Multimodalは電子カルテの複雑な解釈に対応し、MedSigLIPは医療画像分類・検索用の軽量エンコーダです。単一GPUで動作し、4Bはモバイルにも対応。MedQAで64.4%を達成し、胸部X線レポートの81%が放射線科医の評価基準を満たしています。医療アプリ開発の実装ハードルが大きく下がります。

#医療AI #マルチモーダルモデ #Gemma

記事を読む →

🧠

DeepMind3月12日· 2分で読める上級🔥 注目

Introducing Gemma 3

GoogleがGemma 3を発表しました。Gemini 2.0の技術をベースにした軽量オープンモデルで、1B～27Bの4サイズを展開します。単一GPU/TPU上で動作する最高性能モデルとして、Llama 3やDeepSeek-V3を上回る性能を実現。140言語対応、128kトークンコンテキスト、関数呼び出し対応で、デバイス上での実用的なAI開発が可能になります。

#モデル・基盤 #Gemma #軽量モデル

記事を読む →