「松尾研LLM講座2025応用編」アドバンスドコンペの感想をまとめてみた
AI要約
東大松尾研のLLM講座2025応用編で、約200名の上位参加者が競ったアドバンスドコンペに参加した体験記です。AgentBenchという複数ターンのインタラクションを要するベンチマークで、Qwen系の小規模モデルにSFT・DPOで追加学習を施し精度を競います。従来の「単発回答」と異なり、「環境との相互作用を通じて目標を自律達成するエージェント型AI」の能力評価という、新しいLLMの評価軸を垣間見られる貴重な記事です。



