個人開発者がClaudeとMCPを活用して2体のロボット「Six」「Seven」を構築した実例です。クラウドLLMの遅延・トークン制限という現実的な課題に直面し、ローカルLLM(Ollama)やOpenCV、M5 AI Pyramidなどを組み合わせる試行錯誤を重ねています。「LLMはコード生成と判断に長け、リアルタイム処理は苦手」「単純処理はOpenCVの方が確実」といった実装知見が凝縮されており、AI駆動ロボティクスの現場で何が使えて何が使えないかを体感できる記事です。
NVIDIA's GTC 2025 Announcement for Physical AI Developers: New Open Models and Datasets
NVIDIAがGTC 2025で物理AIの開発を加速させる3つのオープンソースを発表しました。7Bパラメータの世界基盤モデル「Cosmos Transfer」は、セグメンテーション・深度マップなど複数の制御信号で高忠実度の仮想シーンを生成。ロボティクスと自動運転向けの商用グレード「Physical AI Dataset」、汎用ヒューマノイド推論モデル「NVIDIA Isaac GR00T N1」も公開され、開発者が大規模で制御可能な合成データ生成を実現できます。