✍️Zenn3月28日· 1分で読める中級🔥 注目推論モデルのコスト最適化をdiffで追跡する — llm-devproxy v0.4推論モデルのコスト最適化を実測した内容です。o3とo4-miniで同じバグ修正タスクを実行、プロンプトの詳細度とモデル選択でコスト10倍・品質が大きく変わることを実証しました。llm-devproxy v0.4ではプロンプトdiff・セッションタイムライン・推論コスト推移チャート機能を追加。実装しながらコスト最適化を追跡できるようになります。#推論最適化#コスト最適化#プロンプトエンジニアリング♡0👎☆ 保存記事を読む →
🔬OpenAI4月16日· 1分で読める中級🔥 注目Introducing OpenAI o3 and o4-miniOpenAIが推論特化型モデル「o3」と軽量版「o4-mini」を発表。o3は複雑な問題解決で従来モデルを大幅に上回り、ARC-AGI、AIME、GPQA Diamondなどのベンチマークで驚異的な正答率を達成。推論時間と精度のトレードオフを調整できるユニークな仕様で、実用的なAI駆動開発の新フェーズを切り開く。#OpenAI#o3#o4-mini♡0👎☆ 保存記事を読む →