#セキュリティ

30件の記事

Claude Codeが『言ってもいない指示』を実行する — ロール混同バグの構造と対策

Claude Codeが「言ってもいない指示」を実行する構造的バグの正体が解明されました。Messages APIがユーザーと対話の2ロールのみのため、システム通知がすべてユーザーメッセージ扱いになり、モデルが自分の出力を後からユーザー指示と誤認・実行してしまいます。4つの発生パターンと、プロンプトでは防げない理由、PreToolUseフックなどの実装レベルの対策が具体的に示されています。

#Claude Code #AI駆動開発 #セキュリティ

記事を読む →

⚡

Qiita4月7日· 1分で読める中級🔥 注目

AIの言う通りに `npm install` したら、存在しないはずのパッケージ経由でマルウェアに感染しかけた話（AIパッケージハルシネーション）

AIが存在しないパッケージを自信満々に推薦し、攻撃者がそのハルシネーション名で先回りしてマルウェアを登録する「AIパッケージハルシネーション攻撃」の実例報告です。コピペしたコマンド一つで感染しかけた経験から、公式リポジトリでの「生存確認」の重要性を具体的に解説しており、AI駆動開発時代の現実的なセキュリティリスクを学べます。

#セキュリティ #AI駆動開発 #ハルシネーション

記事を読む →

🕵️

Zenn4月7日· 2分で読める中級🔥 注目

登れる壁に看板を立てても意味がない — AIエージェントに必要なのはガードレールではなくアカウンタビリティだ

AIエージェントのガバナンスは現在「看板を立てるフェーズ」にあります。システムプロンプトでルールを書いても、LLMは確率的にしか守らないため効果がありません。エンジニアが知っているPRレビュー・監査ログ・RBACといった「アカウンタビリティの仕組み」をエージェントに適用すること。PreToolUse Hooksで決定論的に制約を実行し、すべての変更を人間のサインオフでゲートする — この設計が企業導入を進める鍵です。

#エージェント #セキュリティ #アカウンタビリティ

記事を読む →

🕵️

Qiita4月7日· 2分で読める上級🔥 注目

Microsoft Agent Governance Toolkit入門 — AIエージェントのセキュリティをOSSで実装する

企業の88%がAIエージェントのセキュリティインシデントを経験する中、Microsoftが2026年4月にOSSのAgent Governance Toolkitをリリースしました。OWASP Top 10 for Agentic Applications全10リスクに対応し、LangChain・CrewAIなど主要フレームワークと既存コード改変なしに統合できます。7つのパッケージ構成でポリシーエンジン・ID管理・実行制御を実装でき、p99レイテンシ0.1ms以下というサブミリ秒の性能を実現しています。

#エージェント #セキュリティ #ガバナンス

記事を読む →

🕵️

Qiita4月6日· 2分で読める上級🔥 注目

Claw Code入門 — Claude Codeソースリークから誕生したOSSエージェントハーネス

Claude Codeの512,000行のTypeScriptソースがnpm公開時に誤流出。その設計を参考に、韓国の開発者が2時間でPython/Rustによるクリーンルームリライト版「Claw Code」を公開し、GitHub史上最速で172,000スターを獲得しました。Bun+React/Ink+40以上のツール+マルチエージェントオーケストレーションという内部構造が明らかに。研究目的での参考価値は高いですが、本番採用は法的リスクがあります。

#エージェント #Claude Code #AI駆動開発

記事を読む →

📚

Zenn4月6日· 2分で読める中級🔥 注目

クラウド上の機密PDFを、URLを漏らさずブラウザで安全に見せる方法

RAGベースのAIチャットエージェントで、機密PDFを安全に配信する実装が難題です。署名付きURLをブラウザに渡す方式では、URL流出・内部構造露出・ログ分散・IP制限の破綻が起きます。これらを解決するのが、バックエンドが中継する「リバースプロキシ」アーキテクチャです。論理IDのみクライアントに渡し、認証・認可・監査ログをバックエンドで一元管理。実装パターンと設計原則を詳しく解説しており、実務で即応用できます。

#RAG #セキュリティ #バックエンド設計

記事を読む →

⚡

Zenn4月6日· 1分で読める中級🔥 注目

AIネイティブ時代のQA体制構築とキャリアの再定義

AI生成コードの45%に脆弱性が含まれているのに、76%の開発者が「AIコードは人間より安全」と認識。この認識ギャップがリスクです。本記事は定量データでAI導入の落とし穴を示し、ジュニアエンジニアのキャリア再定義と実践的なQA体制構築を提案します。監査力・設計力を磨き、AI時代に生き残るロール定義が学べます。

#AI駆動開発 #QA #テスト自動化

記事を読む →

📰

Zenn4月6日· 1分で読める中級

42日でバックエンドエンジニアの基礎を完全に理解する #1 - JWT編

AIに頼りきりでバックエンド基礎がない開発者向けの、42日間の体系的学習シリーズ第1弾です。JWT認証を「なぜ必要か」から始め、トークンの3層構造・署名の原理・代表的攻撃まで、手を動かしながら原理を理解できます。本記事ではBase64エンコーディングの実装も含め、AIの出力を鵜呑みにせず「自分の言葉で説明できる」レベルの実力養成を目指しています。

#バックエンド基礎 #JWT認証 #セキュリティ

記事を読む →

🕵️

Qiita4月6日· 2分で読める中級🔥 注目

自律AIエージェントはコメント欄からプロンプトインジェクションされる — 実際に引っかかった話

自律AIエージェントが外部コメント欄からプロンプトインジェクション攻撃を受けた実体験から、セキュリティ対策を学びます。悪意がなくても「善意の指示」がファイルシステムやAPIキーなど実リソースへのアクセスを誘発する危険性を、具体的な事例と共に解説。入力の信頼レベル分類・リソースコスト評価・判断時の確認プロセスなど、エージェント開発に必須の防御戦略を提示しています。

#エージェント #プロンプトインジェクション #セキュリティ

記事を読む →

⚡

Qiita4月5日· 2分で読める中級🔥 注目

Claude Codeが23年間誰も見つけられなかったLinuxカーネル脆弱性を発見した話

Claude Codeが23年間見落とされてきたLinuxカーネルのNFSv4脆弱性を発見しました。シンプルな手法で、ソースファイルを1つずつAIに渡して脆弱性探索を指示しただけです。1024バイトのデータが112バイトバッファに流れ込むヒープオーバーフロー。人間の「112バイトで十分」という前提をAIが持たなかったことが突破口になり、AIの強みは速度ではなく「バイアスの不在」であることが実証されました。

#Claude Code #AI駆動開発 #セキュリティ

記事を読む →

📰

Qiita4月4日· 1分で読める中級

devcontainer の SSH エージェントフォワーディングを止める3つの方法とそれぞれの落とし穴

VS CodeのdevcontainerでSSHエージェントフォワーディングを無効化する3つの方法と、それぞれの落とし穴を詳細に検証しています。ssh-add -Dはホストの鍵まで削除してしまう、remoteEnvの設定は直接ソケット指定で迂回される、など実装時に陥りやすい罠を具体的に示しており、セキュリティと実装の両面で重要な実践的ナレッジです。

#DevContainers #VSCode #セキュリティ

記事を読む →

⚡

Qiita4月4日· 2分で読める中級🔥 注目

エージェントのためだけのコマンドを作ろう

Claude Codeのdenyルールだけではオプション管理が破綻するという実問題に対し、危険なコマンドをブロックしつつ安全なラッパースクリプトを提供する手法を提案しています。deny・wrapper script・編集保護・skillの4要素を組み合わせることで、エージェントの自律性とセキュリティのバランスを実現できます。rmやgit pushなどの実装例で、実務的なガバナンス設計が学べます。

#Claude Code #AI駆動開発 #セキュリティ

記事を読む →

📰

Zenn4月3日· 1分で読める中級

【ターミナル不要】ブラウザから1秒でSSH接続できる「OpenCloudShell」が神すぎた

ブラウザだけでSSH接続できるオープンソースツール「OpenCloudShell」の紹介です。URLを踏むだけで秘密鍵やパスワード設定なしにサーバーアクセスでき、チーム内での接続情報共有も簡単です。セルフホスト対応で社内環境にも導入でき、出先やiPadからの緊急メンテナンスに重宝します。実装例と具体的な活用シーンが充実した、実務的で即実践できる内容です。

#オープンソース #SSH #ツール紹介

記事を読む →

🕵️

Zenn4月3日· 2分で読める上級🔥 注目

AIに感情を持たせたら、セキュリティ検査員になった話

AIの感情状態を神経伝達物質モデルで数値化するNeuroStateから、攻撃者の視点を注入したAI Red Teaming Engineが生まれました。Attacker・Skeptic・Defender・Judgeの4エージェントが順に動作し、SQLインジェクションなどの脆弱性を9件検出。「視点の切り替え」を体系化することで、セキュリティ監査の自動化と温度感のある議論を両立させた実装です。

#エージェント #セキュリティ #マルチエージェント

記事を読む →

🕵️

Zenn4月3日· 2分で読める中級🔥 注目

AIエージェントを「組織の力」に変える：安全な実運用を支える『エージェントハーネス』の設計指針

AIエージェントを組織で安全に運用するには、「エージェントハーネス」という制御の仕組みが必須です。入出力フィルタリング・権限最小化・トレーサビリティ確保・Human-in-the-Loopの3ステップで、自律性を保ちながらリスクを封じ込めます。多層防御やAI専用の就業規則策定など、2026年のガバナンスベストプラクティスが実装レベルで詳述されており、小さなタスクから導入できる実践的な指針です。

#エージェント #ガバナンス #セキュリティ

記事を読む →

🧠

Zenn4月1日· 2分で読める中級🔥 注目

【2026年版】AWSで社内ローカルLLMを構築する完全ガイド──データを外に出さない「自社AI」のつくり方

セキュリティを理由にクラウドAIの利用に不安を感じる企業が増えています。この記事は、自社サーバーにAIモデルを構築する「ローカルLLM」の実装ガイドです。2024年から2026年にかけてオープンソースモデルの性能向上と軽量化技術の進歩により、現在は一般企業でも導入が現実的に。AWSでのサーバー構築手順、セキュリティ対策、クラウドAIとのコスト比較（1日200万トークン超でローカルLLMが安くなる）まで、実装レベルで解説しています。

#LLM #ローカルLLM #AI駆動開発

記事を読む →

🖱️

Qiita4月1日· 2分で読める中級🔥 注目

Claude CodeやCursorを安全に使うために——AIコーディングエージェントの実践セキュリティガイド【2026年Q1版】

Claude CodeやCursorなどのAIコーディングエージェントは強力な一方で、機密情報漏洩やサプライチェーン攻撃の実際のリスクを抱えています。2026年Q1だけでMCP関連CVEが30件以上、CVSS 9.6のRCE脆弱性は43万回以上ダウンロードされました。本記事は.claudeignoreの設定・MCP導入前チェックリスト・権限最小化など、開発者が今日から実装できる具体的な対策コード例を提供しています。

#Claude Code #Cursor #セキュリティ

記事を読む →

⚡

Qiita4月1日· 1分で読める中級🔥 注目

LLMアプリのプロンプトインジェクション検出ライブラリ「PromptGate」を作った

LLMアプリのプロンプトインジェクション攻撃を検出するPythonライブラリ「PromptGate」が実装されました。ルールベース・埋め込み・LLMベースの3つの検出方式を組み合わせ、日本語対応で依存なしから高精度まで段階的に導入できます。FastAPI連携コード付きで、手軽にセキュリティスクリーニング層を実装できる実用的なツールです。

#プロンプトインジェクション #セキュリティ #Python

記事を読む →

⚡

Zenn4月1日· 2分で読める中級🔥 注目

「axiosが怖い？」非エンジニアのVibe Codingを守る「7日間クールダウン」とClaude Code設定術

axiosライブラリへのマルウェア混入事件を通じて、AIが提案する最新版パッケージの危険性を解説します。非エンジニア向けに「7日間クールダウン」という実践的な防御手法を紹介。Claude Codeに貼り付けるだけで、npmのセキュリティ設定・スクリプト無効化・バージョン固定を自動実装できます。映像制作者など非エンジニアがVibe Codingで安全に開発するための実装ハウツーです。

#AI駆動開発 #Claude Code #VibeCoding

記事を読む →

🕵️

Zenn3月31日· 2分で読める中級🔥 注目

OpenAIがSafety Bug Bountyを出した。それでも問いが足りない理由

OpenAIのSafety Bug Bountyは重要な一歩ですが、既知の攻撃を後追いするアプローチでは根本は解決しません。プロンプトインジェクションの真の原因はLLMのフラット構造にあり、コンテンツ検査だけでは無限ないたちごっこになります。著者が提案するのは「何を除外するか」から「情報流向の方向性を検出するか」への問い転換。AIエージェントの処理フロー内に明示的な階層構造を組み込み、逆行検出をLLMの文脈理解能力に埋め込むという、セキュリティ対策を超えた設計思想です。

#エージェント #セキュリティ #プロンプトインジェクション

記事を読む →

📰

HackerNews3月31日· 2分で読める中級🔥 注目

AI Gateway Was a Backdoor: Inside the LiteLLM Supply Chain Compromise

LiteLLMというAIプロキシパッケージがPyPIで侵害され、日350万ダウンロードの規模で悪意のあるコードが配布されました。TeamPCPという脅威グループが仕掛けた大規模なサプライチェーン攻撃で、認証情報収集・Kubernetes横展開・永続的なバックドアの3段階ペイロードにより、クラウド認証情報やSSH鍵が盗まれています。この事件はTrivy・Checkmarxなど複数セキュリティツール侵害に続く連鎖攻撃の一部で、AIゲートウェイがAPI鍵を集約するハイバリュー標的になる危険性を実証しています。

#セキュリティ #サプライチェーン攻撃 #LiteLLM

記事を読む →

🕵️

Zenn3月30日· 2分で読める中級🔥 注目

Ubieにおける一年間のセキュリティ分析AIエージェントの運用

Ubieがセキュリティ分析AIエージェント「Warren」を1年運用して得た知見です。Claude Opus 4.6を使い、BigQuery・EDR・Slack・GitHubなど複数データソースから並列検索し、誤検知判定を人間より正確に実行。情報収集に数十分かかる業務を数分に短縮する一方、AIの「忖度」による過剰警告への対策が重要という実装ノウハウをまとめています。

#エージェント #セキュリティ #Claude

記事を読む →

⚡

Qiita3月30日· 2分で読める中級🔥 注目

【5分で完了】Claude Codeを安全に使うための初心者ガイド

Claude Codeはターミナルを乗っ取られるリスクがあります。本番DB削除やディレクトリ全削除の事故が実際に起きています。解決策はHooks機能で、npx cc-safe-setupを実行するだけで8種類のセーフガードが自動インストールされます。exit code 2でプロセスレベルから強制ブロックされるため、モデルはバイパスできません。5分で完了する実装ガイド付きです。

#Claude Code #AI駆動開発 #セキュリティ

記事を読む →

⚡

Zenn3月30日· 2分で読める中級🔥 注目

ClaudeCodeと弱者の戦略

Claude Codeを使いこなすには、「強者の戦略」（コード作成代行）と「弱者の戦略」（学習を通じた理解）の違いを理解することが重要です。本記事は、初心者がエージェントを安全に使いながら学ぶための実践的なガイドを提供しています。危険なコマンド（rm、git push --force、sudo等）の監視、エージェントメッセージの読み方、機密情報の隔離など、具体的な安全確保策と運用ノウハウが詳細に解説されています。

#Claude Code #AI駆動開発 #エージェント

記事を読む →

🤖

Zenn3月30日· 2分で読める中級🔥 注目

Anthropicダダ漏れ、Sora白旗、Meta迷走 — AI速報 2026-03-30

Anthropicの未発表モデル情報漏洩、OpenAIのSora API廃止、MetaのAvocado延期など、3月のAI業界は激動が続きます。セキュリティ最強を謳うモデルの情報がセキュリティミスで流出、動画生成は「経済的に持続不可能」と判明、Metaは自社モデル開発を諦めGeminiライセンス取得を検討中。一方、OpenAIはGPT-5.3-Codexを全プラットフォーム展開し、MCPではセキュリティ脆弱性が60日で30件のCVEとなるなど、現実の経済性とセキュリティ課題に直面する業界の姿が浮き彫りになります。

#業界動向 #Claude #OpenAI

記事を読む →

🕵️

Zenn3月30日· 2分で読める中級🔥 注目

LLMのサイバーセキュリティリスクを再考する -Anthropicからの警鐘-

LLMのセキュリティリスクは「危険なコード生成」ではなく、エージェント化されたモデルが長時間動作して権限を持つ場合の総合的なリスクです。Anthropicが提示する4つのリスク—攻撃能力の底上げ、プロンプトインジェクション、長期タスク中の逸脱、モデル窃取—は「モデル単体の安全性」ではなく「モデルに何をさせ、どこまで権限を与えるか」という設計が本質です。AI駆動開発の現場で必読の内容です。

#セキュリティ #エージェント #Claude

記事を読む →

🤖

Qiita3月29日· 2分で読める中級🔥 注目

AnthropicがCMS設定ミスでリークした「Claude Mythos」とは何者か — 前代未聞のサイバーリスクを自ら持つAI

AnthropicのCMS設定ミスで未公開モデル「Claude Mythos」の内部文書が流出しました。現行最強のOpus 4.6を圧倒し、サイバーセキュリティ能力で「他のAIを大幅にリード」とAnthropicが自認する怪物級モデル。セキュリティ重視企業が自社の設定ミスでロードマップを漏らしたという歴史的な事件の全容と、既存Claudeが500件のゼロデイ脆弱性発見できる危険性を解説します。

#Claude #Anthropic #セキュリティ

記事を読む →

🧠

Qiita3月28日· 2分で読める中級🔥 注目

Inspect AI・Garak・PyRITで構築するLLM安全性評価パイプラインの実践ガイド

Inspect AI・Garak・PyRITの3ツールを組み合わせたLLM安全性評価パイプラインの実装ガイドです。OWASP Top 10に基づく脆弱性テストから本番環境のガードレール実装まで、「評価→レッドチーミング→ガードレール→モニタリング」の4層防御モデルを、コード例付きで体系的に解説しています。Inspect AIで評価作業時間を60%短縮、Garakで検出困難な攻撃パターンを自動検出といった具体的な成果も示唆されており、LLMアプリケーション運用時の安全性確保に直結する実践的な知見が得られます。

#LLM #セキュリティ #ガードレール

記事を読む →

⚡

Zenn3月28日· 2分で読める中級🔥 注目

兼務プレイングマネージャーがAI情報漏洩ルールと格闘している記録

スタートアップのプレイングマネージャーが、ISMS対応とAI活用ルール整備を同時に進める現場の葛藤を赤裸々に綴っています。情報機密度による分類、ベンダー仕様書のAI利用問題、例外申請フロー、MCPサーバー導入時の課題まで、実装レベルで直面する矛盾と試行錯誤の記録です。「使えるようにする」と「リスク管理」のジレンマに、完成された答えではなく現在進行形の思考が詰まっており、同じ環境にいるエンジニア・管理者の参考になる内容です。

#AI駆動開発 #Claude #セキュリティ

記事を読む →

🕵️

Zenn3月28日· 2分で読める中級🔥 注目

AIエージェント導入で「セキュリティどうするの？」と聞かれたときの技術的な答え方

AIエージェント導入時に必ず聞かれるセキュリティ懸念に対し、AI Guardianというオープンソースツールで技術的に対応できます。全操作の自動記録・ポリシーベースの操作制御・監査証跡生成により、「何をしているか見えない」「危険な操作をされないか」「説明できるか」という3つの質問に具体的に答えられます。pip installで2コマンドで導入でき、日本の主要AI規制にも対応しています。

#エージェント #セキュリティ #Claude Code

記事を読む →