30件の記事
OpenClaw 2026.4.9の本質は「AIが夢を見る」というロマンティックな演出ではなく、記憶の監査性が飛躍的に向上したことです。MEMORY.md、DREAMS.md、memory/YYYY-MM-DD.mdで可視化された記憶を、過去ログから再投入・リセット・ロールバック可能にする「grounded REM backfill」機能により、AIの意思決定の根拠を人間がレビューできるようになりました。セキュリティ強化も同時実装され、実行型エージェント時代に必須の品質基準が整いつつあります。個人開発でも業務でも、持続する記憶の管理設計が次の競争軸になります。
Claude Mythos PreviewはSWE-bench 93.9%を達成した史上最強モデルですが、セキュリティリスクを理由に招待制・防衛的サイバーセキュリティ専用として限定公開されています。全主要OS・ブラウザで数千件のゼロデイを自律発見し、Firefox exploitではOpus比90倍の性能差を示しています。Amazon・Apple・Microsoft等12社以上が参加するProject Glasswingの中核として機能し、$100M使用クレジットが投下される、AIセキュリティの大転換点を示す発表です。
Claude DesktopのCoworkモード(ローカルエージェント)でブラウザ操作がPermission deniedになる原因を徹底解析した実践記事です。サイドパネルでは動くのにCoworkでは拒否される理由は、異なる権限フロー。Coworkはサーバー側APIでドメインをカテゴリ分類し、制限カテゴリに該当すると即座に拒否するため。設定画面でデフォルトを「拡張機能を許可」に変更する解決策まで示されており、同じ問題に直面したエンジニアの実装障害を即座に解決できます。
Cursor 3がVS Codeフォークから全面再設計された背景が鮮明に見えます。VS Codeは月次更新への追従コスト、拡張機能の互換性問題に加え、本質的に「人間操作の補助」設計であり、エージェントが自律的にファイル・ターミナル・Gitを統合制御するプリミティブが欠けていました。Cursor 3は「Agents Window」で複数エージェントの並列実行、Git Worktreeによる隔離実行、一元的なツールアクセスを実現。開発者はコード作成者からオーケストレーターへ役割転換します。
autoresearchやRalph Loopなど注目を集めるAIエージェント系ツールの違いが分からない——そんな疑問に答える俯瞰的整理記事です。約220件の論文とOSSを調査した著者が、Agent Loopを「逐次実行型」「仮説検証型」「自己進化型」の3グループ、7つの型に分類。線形ReAct・Event Stream・木探索・制約付き実験など、各型の使い分けを代表プロジェクトとともに解説しています。実装レベルで何が違うのか、どの場面で何を選ぶべきか?が明確に理解できます。
企業の88%がAIエージェントのセキュリティインシデントを経験する中、Microsoftが2026年4月にOSSのAgent Governance Toolkitをリリースしました。OWASP Top 10 for Agentic Applications全10リスクに対応し、LangChain・CrewAIなど主要フレームワークと既存コード改変なしに統合できます。7つのパッケージ構成でポリシーエンジン・ID管理・実行制御を実装でき、p99レイテンシ0.1ms以下というサブミリ秒の性能を実現しています。
AntigravityはAIコーディング補助ツールではなく、開発の役割分担そのものを再設計するプラットフォームです。エージェントがエディタ・ターミナル・ブラウザを横断して自律的に計画・実行・検証し、その証跡をArtifactsで残します。CursorやClaude Codeの「並走感」とは異なり、「キーボードから離れた状態で進む仕事」を実現。Googleは試作はAI Studio、ローカル開発はAntigravityと明確に棲み分けを始め、これはIDEの再定義の入口と考えられます。