Transformerのパラメタ数を増やした際の観察
AI要約
Transformerのパラメタ数を13M〜115Mで変化させ、同一データセット(300文)での学習を比較しました。パラメタが多いほど収束は速いものの、訓練済み事実の正答率は単調増加せず、モデルサイズごとに得意領域が異なることが判明。未学習事実への汎化はパラメタ数に関わらずほぼ0%のままで、単なるパラメタ増加では汎化能力は向上しないことを実験的に示しています。
AI要約
Transformerのパラメタ数を13M〜115Mで変化させ、同一データセット(300文)での学習を比較しました。パラメタが多いほど収束は速いものの、訓練済み事実の正答率は単調増加せず、モデルサイズごとに得意領域が異なることが判明。未学習事実への汎化はパラメタ数に関わらずほぼ0%のままで、単なるパラメタ増加では汎化能力は向上しないことを実験的に示しています。
Claude Mythosはステップチェンジ級の強力なモデルで、主要OS・ブラウザの数万件のゼロデイ脆弱性を発見し、83.1%の成功率でPoC作成も可能です。AnthropicはProject Glasswingで防衛目的に限定展開。この発表で大手サイバーセキュリティ企業株が5~11%下落、SaaS業界の再編不安が高まっています。


Claude Mythos PreviewはSWE-bench 93.9%を達成した史上最強モデルですが、セキュリティリスクを理由に招待制・防衛的サイバーセキュリティ専用として限定公開されています。全主要OS・ブラウザで数千件のゼロデイを自律発見し、Firefox exploitではOpus比90倍の性能差を示しています。Amazon・Apple・Microsoft等12社以上が参加するProject Glasswingの中核として機能し、$100M使用クレジットが投下される、AIセキュリティの大転換点を示す発表です。