#トークン最適化

5件の記事

Claude Codeのトークン消費が突然10倍になる原因と、hookで防ぐ実践的な方法

Claude Codeでトークン消費が10倍に急増する現象はプロンプトキャッシュの無効化が原因です。セッションファイル読み取りによるキャッシュ汚染、セッション再開時のミス、並列サブエージェント競合の3つが主犯。hook機能を使ったセッションファイルブロック、コンテキスト監視、キャッシュ再構築検出など5つの実践的防止策が、動作するコード付きで解説されています。

#Claude Code #AI駆動開発 #トークン最適化

記事を読む →

⚡

Qiita3月29日· 1分で読める中級🔥 注目

【markdive】AIエージェントのMarkdown読解を、目次から読む形に変えるCLI

AIエージェントが仕様書やREADMEを読む際の非効率さを解決するCLI「markdive」が登場しました。従来の上から順読みではなく、目次から必要な章を段階的に探索する「dive」と精読する「read」の2段階設計により、トークン消費を削減できます。段階的開示・構造的アドレッシング・文脈保全の設計思想に基づき、npmで公開されており即座に導入できます。

#AIエージェント #AI駆動開発 #CLI

記事を読む →

🕵️

Zenn3月11日· 2分で読める中級

DiscordからOpenClawを起動・停止する

OpenClawの常時起動でトークンを浪費する課題に対し、Discord Botで起動・停止を遠隔操作できるツールを実装した事例です。個人検証環境で6日間の使用制限に直面した著者が、systemctlを使ったシンプルな構成で実現。スマホから気軽に制御でき、無料VPS上で低コスト運用できます。AIエージェント実装時の現実的な運用課題と解決方法が具体的に学べます。

#エージェント #AI駆動開発 #OpenClaw

記事を読む →

🤖

Qiita3月9日· 2分で読める中級

Claude CLIでトークンを節約するためのモデル設定方法

Claude CLIでトークン消費を抑えるには、タスクの複雑度に応じてモデルを使い分けることが重要です。haiku（軽量）・sonnet（標準）・opus（高性能）を、ログ確認や軽微な修正ならhaiku、通常実装ならsonnet、複雑な推論のみopusという基準で使い分けます。シェルaliasで起動時モデルを設定、/modelコマンドでセッション中に切り替え、settings.jsonでグローバル設定できます。実務的な運用例も示されており、すぐに実践できる内容です。

#Claude #CLI #トークン最適化

記事を読む →

🕵️

HackerNews3月8日· 2分で読める中級🔥 注目

Show HN: AI agents run my one-person company on Gemini's free tier – $0/month

台湾の個人開発者がGemini 2.5 Flashの無料枠だけを使い、4つのAIエージェントで会社全体を自動運営しています。月額0円で、ソーシャルメディア投稿・リード生成・セキュリティスキャン・運用監視を実行。工夫はトークン効率：事前計算したマークダウンをコンテキストに注入し、各リクエストを単一の集中したプロンプトに圧縮することで、月1,500リクエストの枠に対し7%しか使っていません。エージェント本体の実装＋失敗例・解決策も公開されているため、スケーラブルな自動化システム設計を実践的に学べます。

#エージェント #AI駆動開発 #Gemini

記事を読む →