30件の記事
Antigravity IDEの出力トークン制限の実態を2日間の調査で明かした技術レポートです。全プランで16,384トークン/ターン、思考トークンは1,024にハードコードされており、Claude Opus・Gemini 3.1 Proの本来の能力(128K・65.5K)の12.8%、25%しか使えていません。最も危険なのはGeminiのサイレントトランケーション—エージェントが出力切断を認識できない仕様です。月額$250でこの制限は、同価格帯のツールと比べて根拠不明な制約になっています。
2026年2-3月にGPT-5.4・Claude Opus 4.6・Gemini 3.1 Proが相次ぎリリースされました。SWE-bench Verifiedでは両者とも80%超を達成し、コード自動修正が現実的になっています。本記事は単なるスコア比較ではなく、各社の戦略的意図を分析。OpenAIはエージェント制空権、AnthropicはClaude Codeによる開発者体験の囲い込み、GoogleはWorkspace統合による実務浸透と、「モデル性能」より「エコシステム戦略」で差別化していることを指摘します。ベンチマーク詳解と価格表で、ツールチェーン選定の実践的判断軸が得られます。
2026年3月にGoogleがリリースしたGemini Embedding 2は、テキスト・画像・動画・音声・PDFを同じベクトル空間に埋め込める世界初のマルチモーダル埋め込みモデルです。これまでRAGではコンテンツの種類ごとに異なるモデルを使う「継ぎ接ぎ問題」がありましたが、単一ベクトル空間で統一することで、テキスト質問と画像回答を直接比較できるようになります。Pythonの実装コード付きで、3072~768次元の柔軟な出力とMRL採用により、検索品質と計算コストのバランスを自在に調整できます。