Zenn· 1分で読める上級🔥 注目
SDG-LOOM — LLMによる大規模合成データ生成フレームワーク
AI要約
LLMでの大規模合成データ生成を、コード不要で実現するフレームワークSDG-LOOMが登場しました。YAMLでパイプラインを宣言的に定義し、適応型並列制御やバッチ処理を自動化することで、数万~数十万件規模のデータセットを安定生成できます。GUIエディタも備え、エンジニア以外も参加可能な環境を実現。ファインチューニングやNLPデータ拡張に即戦力となります。
AI要約
LLMでの大規模合成データ生成を、コード不要で実現するフレームワークSDG-LOOMが登場しました。YAMLでパイプラインを宣言的に定義し、適応型並列制御やバッチ処理を自動化することで、数万~数十万件規模のデータセットを安定生成できます。GUIエディタも備え、エンジニア以外も参加可能な環境を実現。ファインチューニングやNLPデータ拡張に即戦力となります。
NVIDIAがGTC 2025で物理AIの開発を加速させる3つのオープンソースを発表しました。7Bパラメータの世界基盤モデル「Cosmos Transfer」は、セグメンテーション・深度マップなど複数の制御信号で高忠実度の仮想シーンを生成。ロボティクスと自動運転向けの商用グレード「Physical AI Dataset」、汎用ヒューマノイド推論モデル「NVIDIA Isaac GR00T N1」も公開され、開発者が大規模で制御可能な合成データ生成を実現できます。