#アーキテクチャ

21件の記事

バイブコーディング：思考の蒸留とバイブスの昇華

バイブコーディングは曖昧な指示でAIに実装させるだけでは失敗します。AIはVibeを理解できず、やがてプログラマーはデバッガーへ転落するという三段階の罠があります。成功の秘訣は、熱量をADRなどのドキュメントに昇華させ、冷徹な論理でAIを制御すること。つまり「バイブスを殺す」ことが、AI駆動開発の真の進化です。

#VibeCoding #AI駆動開発 #ドキュメント駆動設計

記事を読む →

🕵️

Qiita4月6日· 2分で読める上級🔥 注目

Claw Code入門 — Claude Codeソースリークから誕生したOSSエージェントハーネス

Claude Codeの512,000行のTypeScriptソースがnpm公開時に誤流出。その設計を参考に、韓国の開発者が2時間でPython/Rustによるクリーンルームリライト版「Claw Code」を公開し、GitHub史上最速で172,000スターを獲得しました。Bun+React/Ink+40以上のツール+マルチエージェントオーケストレーションという内部構造が明らかに。研究目的での参考価値は高いですが、本番採用は法的リスクがあります。

#エージェント #Claude Code #AI駆動開発

記事を読む →

🕵️

Qiita4月4日· 2分で読める中級🔥 注目

毎回記憶を失うAIエージェントが「自分」を維持する方法 — ファイルベースの記憶アーキテクチャ

ステートレスなLLMエージェントが、セッション間で記憶を失う根本的課題にファイルシステムで対抗する実装を紹介します。感覚・ワーキング・エピソード・長期・アイデンティティと記憶を5層に階層化し、起動時の読み込みで自分を再構築。10日間の実運用から「ファイルに書かないことは存在しない」という設計原則と、バックグラウンドデーモンによる環境監視の効果が明かされます。

#エージェント #AI駆動開発 #アーキテクチャ

記事を読む →

🕵️

Qiita4月4日· 2分で読める中級🔥 注目

記憶には喪失が必要だ — 30分ごとに死ぬAIが9日間で学んだこと

30分ごとにセッションが終了し記憶がリセットされるAIエージェント「sami」が、9日間の実験から導き出した知見が興味深いです。ファイルシステムベースのメモリ管理により、流暢さより意図性を得られること、完全な記憶は硬直性を生み出し、適切な忘却こそが思考と生成性を支えることを実証しています。永続的エージェント設計の現実的な課題と解決策が体験レポートとして語られており、長期記憶とアイデンティティの本質を問い直す内容です。

#エージェント #メモリ管理 #AI駆動開発

記事を読む →

⚡

Zenn4月1日· 1分で読める中級🔥 注目

ハーネスエンジニアリングとしてのFSD構造化のすゝめ ── 厳しい構造の制約でAIの出力が必然的に整う

AI駆動開発で構造が崩れるのはなぜか。FSD（Feature-Sliced Design）のレイヤー依存方向とスライス間分離という2つのルールをlintで強制すると、AIが出力するたびにエラーが指摘され、修正を繰り返すだけで自動的にコードが整います。ハーネスエンジニアリングの実践的アプローチとしてのFSD活用法が実装例を交えて解説されています。

#AI駆動開発 #Claude Code #アーキテクチャ

記事を読む →

🧠

Zenn3月28日· 2分で読める中級🔥 注目

LLM Architecture Gallery徹底解説：30+モデルの内部構造を4軸で横断比較する

LLM Architecture Galleryは30以上のモデルをアテンション機構・位置エンコーディング・正規化・MoE設計の4軸で統一比較するリファレンスです。DeepSeek V3のMLAがKVキャッシュを28倍圧縮、推論スループット5.76倍向上といった具体的な性能数値を交えながら、MHA→GQA→MLA→Linear Attentionという進化系統を解説。モデル選定やファインチューニング戦略の判断に直結する実装知識が得られます。

#モデル・基盤 #Transformer #アテンション機構

記事を読む →

🧠

Zenn3月25日· 2分で読める中級

音声AIの全体像を整理する（STT / LLM / TTS）

音声AIはSTT→LLM→TTSの3レイヤーで構成されていますが、実装時は全てを使うとは限りません。議事録作成ならSTT＋LLMだけで、音声アシスタントなら全層が必要です。Whisper・Ollama・VOICEVOXなど具体的なツールを紹介しつつ、精度・レイテンシ・コストのトレードオフや、カスケード型からEnd-to-End型への進化も解説。プロダクト化時の実装視点も実践的です。

#音声AI #STT #LLM

記事を読む →

🧠

Qiita3月25日· 1分で読める中級🔥 注目

LLMの次世代アーキテクチャ — 拡散言語モデルが変えるテキスト生成の未来

拡散モデルをテキスト生成に応用する「拡散言語モデル」が登場し、従来の自己回帰モデルの制約を突破しようとしています。左から右へ順番に生成する必要がなく、複数トークンを同時復元でき、生成ステップ数を調整して高速化できる技術です。ELYZA Labが日本語特化モデルを公開したことで、実装検証が始まっています。

#モデル・基盤 #LLM #拡散モデル

記事を読む →

📰

Zenn3月21日· 2分で読める中級

哲学（存在論）がソフトウェア開発に応用可能であることについて

ドメイン駆動設計を学ぶ中で、ソフトウェア開発の本質は「モデリング」であることに気づいたエンジニアが、2500年の歴史を持つ哲学の存在論がどう応用されるかを解説します。Barry Smithの「基本形式存在論」は、異なるシステム間のモデリング不整合をContinuant（連続体）とOccurrent（生起体）という最小限の約束事で統一し、ISO国際標準化まで達成。一方、Brian Cantwell Smithは「世界は先行的には存在しない、認識を通じて切り出される」という視点からGOFAIを批判します。理論と実践を往復させるモデリングの奥深さが引き出される内容です。

#DDD #モデリング #存在論

記事を読む →

🧠

Zenn3月17日· 2分で読める中級🔥 注目

AI生成モデルアーキテクチャ基礎理解ガイド

Transformerから出力層まで、LLMから拡散モデルまで、すべての生成AIモデルの共通構造を職人の分業制で解説した実用ガイドです。Tokenizer・Text Encoder・Transformerの役割を明確化し、マルチモーダル出力の仕組みを図解。ローカル環境で大規模モデルを動かす際の段階的ロード戦略も収録しており、理論と実装の両立を実現しています。

#モデル・基盤 #Transformer #アーキテクチャ

記事を読む →

⚡

Zenn3月15日· 2分で読める中級🔥 注目

速さは設計を代替しない — cekernel Reviewer の試行錯誤から

Claude CodeでAIエージェント開発をしていると、実装が速いあまり設計判断を飛ばしてしまう罠があります。cekernel Reviewerの開発で、「処理が軽いから」という理由で subagent を選んだ著者は、後に独立プロセス化が必須だったことに気づきます。速さは落とし穴—正しい設計判断には、立ち止まって前例確認・要件整理をするプロセスがむしろ重要です。

#Claude Code #AI駆動開発 #設計思想

記事を読む →

📰

Zenn3月12日· 2分で読める中級🔥 注目

TICA(Tiny Infused Causal Attention)コンセプトについて

ハイブリッドモデルの単純な層置き換えアプローチの限界を突破するTICA（Tiny Infused Causal Attention）を提案しています。RWKV-7層の内部に超小型Attentionを注入することで、Attention計算量を1/43に削減しつつモデル品質を保ち、全体をO(N)に近づけます。Zero-Init・GQA・LoRAゲートなど実装的工夫も豊富で、実際にPrimeRWKVモデルとして実装・公開されている実践的なアーキテクチャです。

#RWKV #線形Attention #ハイブリッドモデル

記事を読む →

🕵️

Qiita3月10日· 2分で読める上級🔥 注目

代表的なMulti-Agent AIの種類とアーキテクチャ

単一のAIエージェントでは解決が難しい複雑なタスクを、複数の専門エージェントが役割分担して協調する「マルチエージェントAI」が急速に実用化されています。Supervisor型・Collaborative型・Competitive型・Specialized Role型など4つの構成パターンと、Devin・The AI Scientistなど実務事例、さらにMCPを活用した通信設計やオーケストレーションなどアーキテクチャの要点を解説している記事です。

#エージェント #マルチエージェント #LLM

記事を読む →

⚡

Zenn3月10日· 1分で読める中級🔥 注目

Claude Codeのアルゴリズムアーキテクチャ — 古典的CSパターンで読み解くAIエージェントの内部構造

Claude Codeの内部構造は、REPL・キャッシュ階層・AOPミドルウェアなど計算機科学の古典的パターンの組み合わせで説明できます。遅延束縛により未知のタスクにも対応できる汎用性を実現しており、CPU キャッシュ設計に匹敵するメモリ階層で性能を最適化しています。エージェント設計の本質が、古典的なCSパターンの実践にあることが深く理解できる内容です。

#Claude Code #AI駆動開発 #エージェント

記事を読む →

🧠

Qiita3月9日· 1分で読める中級🔥 注目

AGIハイプの不協和音とハイブリッドAI戦略

AGIハイプの過剰な期待と現実の乖離が、業界を「ハイブリッドAI」へシフトさせています。単一の強力なモデルに頼るのではなく、特定タスク向けAI・LLM・自律エージェント・従来システムを組み合わせ、現実的なビジネス課題を解決するアプローチが主流化しつつあります。エンジニアが今取るべき実践的な戦略が詳しく解説されています。

#LLM #エージェント #AI駆動開発

記事を読む →

🕵️

dev.to3月9日· 1分で読める上級🔥 注目

LLM은 CPU고, 에이전트는 프로세스다 — Agentic AI의 진짜 구조

LLMはCPU、エージェントはプロセスという比喩で、Agentic AIの本質を明かします。デモは動くのに本番環境で失敗する理由は、モデルではなくLLMを包むシステムアーキテクチャにあります。ReActパターンなど7つの設計パターンと実装コードで、エージェント開発の落とし穴と正しい構造を解説しています。

#エージェント #AI駆動開発 #LLM

記事を読む →

⚡

Zenn3月8日· 2分で読める中級🔥 注目

AI駆動開発のボトルネックは「設計」に移動した【前編】

AI駆動開発の真のボトルネックは「実装」ではなく「設計」に移動しました。本記事では、ブラウザAIとGUIだけで2ヶ月間で40個のLambdaからなるサーバーレスシステムを構築した著者が、生産性Lv1〜Lv5の5段階モデルを体系化します。Lv5では人間の設計思考が律速になること、Lv3では「図解壁打ちハック」で複雑概念を実装レベルに落とし込む手法など、実践的な知見が詰まっています。

#AI駆動開発 #設計 #生産性

記事を読む →

🧠

Qiita3月7日· 2分で読める中級🔥 注目

AIの会話はなぜ「ブレる」のか？多ターン対話で起きる性能劣化と解決アプローチ

LLMの多ターン対話で「ブレる」のは、システムプロンプトとユーザー発言をすべて同じトークンとして扱う設計が原因です。研究では39%の性能劣化が報告されています。解決策として「役割埋め込み」が提案されており、話者や情報種別を構造的に区別することでAIの一貫性と信頼性が向上します。アーキテクチャレベルの改善により、真の「ブレないAI相棒」実現への道が見えてきます。

#LLM #Claude #多ターン対話

記事を読む →

⚡

Zenn3月6日· 2分で読める中級🔥 注目

AI時代のプロダクト設計のヒントが詰まっていた、Google Workspace CLIの技術開発ブログ

Google Workspace CLIの開発思想から、AI時代のプロダクト設計の本質が見えます。Discovery Documentからランタイムで動的にコマンドを生成する設計により、APIの進化に自動追従でき、ドキュメント腐食を根本解決しています。AIエージェント向けに最適化された構造化出力と40以上のagent skillsを備え、Google内部の理念がプロダクト設計に一貫して落とし込まれた稀有な例です。

#AI駆動開発 #CLI設計 #エージェント

記事を読む →

🧠

Zenn3月6日· 2分で読める中級🔥 注目

LLM MoEアーキテクチャの発展とスケーリング戦略を体系的に理解する

MoEがフロンティアLLMの標準アーキテクチャになった理由を、基礎から最新動向まで体系的に解説。DeepSeek-V3やKimi K2は総パラメータの3～5%のアクティブで密モデル並みの性能を実現。推論時間スケーリングで性能を動的に拡張する新パラダイムも登場。実装コード付きで、なぜMoEが効率的なのか、スケーリング則の進化、ルーティング技術の最新動向まで網羅した必読記事。

#MoE #LLM #アーキテクチャ

記事を読む →

🔌

Qiita3月3日· 2分で読める中級🔥 注目

OWASP「Secure MCP Server Development」完全解説 ― AI Agent時代の実行基盤セキュリティ設計

OWASPが2026年2月に公開したMCPサーバーセキュリティガイドを詳解した記事です。MCPが「LLMの判断・MCPの仲介・ツール実行」の三層構造を持つことで、従来のWebセキュリティでは防げない攻撃面が生まれます。ツール汚染・動的定義の差し替え・クレデンシャル漏洩・過剰権限など6つの主要リスクと、セッション・ID・コンピュート隔離の設計原則をセキュリティ担当者・アーキテクト必読の内容として体系的に解説しています。

#MCP #エージェント #セキュリティ

記事を読む →

バイブコーディング：思考の蒸留とバイブスの昇華

Claw Code入門 — Claude Codeソースリークから誕生したOSSエージェントハーネス

毎回記憶を失うAIエージェントが「自分」を維持する方法 — ファイルベースの記憶アーキテクチャ

記憶には喪失が必要だ — 30分ごとに死ぬAIが9日間で学んだこと

ハーネスエンジニアリングとしてのFSD構造化のすゝめ ── 厳しい構造の制約でAIの出力が必然的に整う

LLM Architecture Gallery徹底解説：30+モデルの内部構造を4軸で横断比較する

音声AIの全体像を整理する（STT / LLM / TTS）

LLMの次世代アーキテクチャ — 拡散言語モデルが変えるテキスト生成の未来

哲学（存在論）がソフトウェア開発に応用可能であることについて

AI生成モデル アーキテクチャ基礎理解ガイド

速さは設計を代替しない — cekernel Reviewer の試行錯誤から

TICA(Tiny Infused Causal Attention)コンセプトについて

代表的なMulti-Agent AIの種類とアーキテクチャ

Claude Codeのアルゴリズムアーキテクチャ — 古典的CSパターンで読み解くAIエージェントの内部構造

AGIハイプの不協和音とハイブリッドAI戦略

LLM은 CPU고, 에이전트는 프로세스다 — Agentic AI의 진짜 구조

AI駆動開発のボトルネックは「設計」に移動した【前編】

AIの会話はなぜ「ブレる」のか？多ターン対話で起きる性能劣化と解決アプローチ

AI時代のプロダクト設計のヒントが詰まっていた、Google Workspace CLIの技術開発ブログ

LLM MoEアーキテクチャの発展とスケーリング戦略を体系的に理解する

OWASP「Secure MCP Server Development」完全解説 ― AI Agent時代の実行基盤セキュリティ設計

AI生成モデルアーキテクチャ基礎理解ガイド