Qiita2026年3月9日· 2分で読める上級🔥 注目

「松尾研LLM講座2025応用編」アドバンスドコンペの感想をまとめてみた

AI要約

東大松尾研のLLM講座2025応用編で、約200名の上位参加者が競ったアドバンスドコンペに参加した体験記です。AgentBenchという複数ターンのインタラクションを要するベンチマークで、Qwen系の小規模モデルにSFT・DPOで追加学習を施し精度を競います。従来の「単発回答」と異なり、「環境との相互作用を通じて目標を自律達成するエージェント型AI」の能力評価という、新しいLLMの評価軸を垣間見られる貴重な記事です。

#LLM #エージェント #SFT #DPO #AgentBench #松尾研 #AI駆動開発 #ファインチューニング

𝕏 ポスト B! はてブ

元記事を読む →

「松尾研LLM講座2025応用編」アドバンスドコンペの感想をまとめてみた

関連記事

1人でAIチームを作る方法（PM・エンジニア・レビュアー）

ベクトル検索は不要なのか

教育を「最短経路問題」として解いてはいけない理由 ── 近代教育の父ペスタロッチ vs 6人のAI

「オープンソースAIこそ正義」って言ってたじゃないか、、、ザッカーバーグが、クローズドモデルを出した日 ─ Meta Muse Sparkの全貌