🧠Zenn4月7日· 2分で読める中級🔥 注目Gemma 4がローカルLLMの実務投入で頭ひとつ抜けていた話Gemma 4がローカルLLMの実務投入で真価を発揮します。株価予測タスク(500件の開示から方向を推定)でQwen 3.5に対し精度88% vs 71%、空振り4件 vs 19件と圧倒的に上回りました。特にMoE版(26b)は精度を損なわずVRAM 17GBで最速(0.8秒応答)を実現。「定型的な情報」と「実質的な材料」を区別できる能力が、実務投入で決定的に効きます。#LLM#Gemma#ローカルLLM♡0👎☆ 保存記事を読む →
📰Zenn4月7日· 2分で読める中級Googleが「Gemma 4」と「Veo 3.1 Lite」を公開——「エッジAI」って何?スマホの中でAIが動く時代が来たGoogleがGemma 4とVeo 3.1 Liteを公開し、エッジAI時代の到来を示しました。エッジAIはスマホやデバイス内でAIが動く技術で、クラウド不要・データ送信不要・低遅延・低コストが特徴です。Gemma 4は数十億パラメータの軽量モデル、Veo 3.1 Liteは動画生成の軽量版。これにより中小企業や医療・金融など機密情報を扱う業界でも安全かつ安価にAIが使える環境が整います。#エッジAI#Gemma#Google♡0👎☆ 保存記事を読む →
🧠Qiita4月4日· 2分で読める上級🔥 注目【実践】Gemma4-31BをQLoRAで日本語エージェントに特化させる手順とベンチマークGemma4-31BをQLoRAで日本語エージェントに特化させた実装レポートです。ClippableLinearやmm_token_type_idsといったGemma4特有のハマりポイント解決法を公開。1,546サンプルでファインチューニングした結果、Function Calling・Multi-step ReActで+2.0の性能向上を達成。Claude Codeのトークン消費削減を目指すローカルサブエージェント構築の実践的なノウハウが詰まっています。#LLM#QLoRA#ファインチューニング♡0👎☆ 保存記事を読む →
🧠Zenn4月3日· 2分で読める中級🔥 注目Google Gemma 4 実践ガイド — Ollama・HuggingFace で動かすマルチモーダル対応オープンモデルGoogle が Apache 2.0 ライセンスでリリースした Gemma 4 は、テキスト・画像・音声・動画対応のマルチモーダルモデルです。Gemini 3 の技術をベースに、Gemma 3 から数学で 20.8% → 89.2%、コーディングで 29.1% → 77.1% と圧倒的な性能向上を実現。Ollama・HuggingFace Transformers での動かし方から Function Calling まで、ハンズオンで習得できる実践的なガイドです。#Gemma#LLM#モデル・基盤♡0👎☆ 保存記事を読む →
📰DeepMind10月25日· 2分で読める上級🔥 注目MedGemma: Our most capable open models for health AI developmentGoogleが医療AI開発向けのオープンモデル「MedGemma」の新版を発表しました。27B Multimodalは電子カルテの複雑な解釈に対応し、MedSigLIPは医療画像分類・検索用の軽量エンコーダです。単一GPUで動作し、4Bはモバイルにも対応。MedQAで64.4%を達成し、胸部X線レポートの81%が放射線科医の評価基準を満たしています。医療アプリ開発の実装ハードルが大きく下がります。#医療AI#マルチモーダルモデ#Gemma♡0👎☆ 保存記事を読む →
🧠DeepMind3月12日· 2分で読める上級🔥 注目Introducing Gemma 3GoogleがGemma 3を発表しました。Gemini 2.0の技術をベースにした軽量オープンモデルで、1B~27Bの4サイズを展開します。単一GPU/TPU上で動作する最高性能モデルとして、Llama 3やDeepSeek-V3を上回る性能を実現。140言語対応、128kトークンコンテキスト、関数呼び出し対応で、デバイス上での実用的なAI開発が可能になります。#モデル・基盤#Gemma#軽量モデル♡0👎☆ 保存記事を読む →