Open R1: Update #3
AI要約
DeepSeek-R1の推論手法をオープンソース化するOpen R1プロジェクトの最新成果です。競技プログラミングに特化した約10万サンプルのCodeForces-CoTsデータセットと、IOI(国際情報オリンピック)ベンチマークを公開しました。これらで訓練したOlympicCoder-32Bモデルは、Claude 3.7 Sonnetなどの閉鎖型frontier モデルを上回り、100倍以上大きなモデルも凌駕しています。実装可能な高品質データセットとベンチマークが揃い、コード推論の民主化が進みます。



