🕵️Qiita3月17日· 2分で読める上級🔥 注目松尾研LLMコンペ2025 アドバンスド参戦記 — 100+モデル作って学んだこと松尾研LLMコンペで100以上のモデルを試行錯誤した実験レポートです。効いた施策はハイパーパラメータ探索(LoRA rank=32が最適)、Instruction Masking、フォーマット統一など。重要な失敗知見として「eval_lossは性能を予測しない」「rankは大きいほど良くない」「モデルマージは万能ではない」を実証。実装者にとって即座に応用できる、生の知識が詰まっています。#ファインチューニング#LoRA#エージェント♡0👎☆ 保存記事を読む →
🧠Qiita3月15日· 2分で読める上級🔥 注目エッジ型SIEM基盤実装(OSS推進フォーラム)セキュリティ運用の課題を解決するため、ローカルLLMとManticoreSearchを組み合わせたエッジ型SIEM基盤の実装を紹介しています。LLaMA2をLoRAでファインチューニングしGGUF量子化することで、わずか4GBのモデルでCPU推論を実現。ルールベース検知の限界を超え、複数ログの文脈的相関分析を自動化し、クラウド依存を排除しながら説明可能な脅威検知が可能になります。#LLM#LLaMA#エッジAI♡0👎☆ 保存記事を読む →
⚡Zenn3月6日· 2分で読める上級🔥 注目AWS Trainium/Inferentiaで言語モデルの訓練と推論AWS TrainiumでQwen3をLoRAファインチューンし、推論サーバーまで構築する実装ガイドです。Optimum-Neuronを使った分散訓練の具体的な手順、チェックポイント統合(consolidate)の非自明な操作、tensorboardでのloss確認まで、実装上の落とし穴を交えて解説しています。オンプレGPUと異なるNeuronコアへの最適化がポイントです。#AWS Trainium#ファインチューニング#Optimum-Neuron♡0👎☆ 保存記事を読む →