長い会話でLLMの精度は最大33%落ちる——「コンテキスト崩壊」とコーディングエージェントへの影響
AI要約
Stanford研究が衝撃の結果を発表しました。GPT-5含む最新LLMでも、長い会話では精度が最大33%低下する「コンテキスト崩壊」が発生します。コーディングタスクでも10~20%の精度低下が確認されており、Claude CodeやCodex CLIでの長時間セッションに直結する課題です。パラメータ調整では解決不可能で、セッションリセット+要約引き継ぎという実践的な対策を、具体的なワークフロー例と共に解説しています。



