#因果推論

3件の記事

LLMエージェントの失敗を因果グラフで診断するOSSを作った — 設計思想と「できないこと」

LLMエージェントの失敗を因果グラフで自動診断するOSSを開発した事例です。単なるログ分析ではなく、17のFailure Patternと15の因果関係から根本原因を特定します。決定論的で説明可能性を優先し、LLMによる評価を避けることで再現性を確保。ヒューリスティックの限界も明示し、実務的な診断ツールとしての設計思想が学べます。

#エージェント #デバッグ #因果推論

記事を読む →

📰

Zenn3月30日· 2分で読める中級🔥 注目

Causal Circuit-Guided Pruning: 因果推論に基づくTransformerの機能保持圧縮とWandaとの比較

Transformerの圧縮手法における「相関」と「因果」の根本的な違いを正面から捉えた研究です。従来のWanda等は重みの大きさや入力活性度といった相関指標に頼っていますが、提案するCC-Pruneは因果推論（Pearl のdo-operator）を導入し、Activation Patchingで「本当に必要なコンポーネント」を特定します。高圧縮率でWandaを上回る性能の理論的・実験的証拠を示しており、LLM圧縮の実装者必読です。

#モデル圧縮 #因果推論 #Transformer

記事を読む →

✍️

Qiita3月7日· 1分で読める中級🔥 注目

Causal Thinking Determines AI Dialogue Quality — 4,590 Hours of Observation Through Pearl's Causal Hierarchy and Measurable Hypotheses

AIの回答品質は因果的思考の深さで決まり、コード読み書き能力は無関係です。Pearl因果階層に基づき、LLMはL1（観測）レベルに留まり、L1入力からL2（介入）以上の応答は導出できません。4,590時間の対話実験から、プロンプト技法の巧みさではなく「入力における因果密度」が対話品質を左右することを実証しています。

#プロンプトエンジニアリング #因果推論 #LLM

記事を読む →