15件の記事
ChatGPTは日本語が英語より低精度なのは気のせいではありません。学習データに占める日本語の割合は約4%(英語の1/10以下)で、さらにトークナイザーの仕様で日本語は1文字あたり約1トークン必要なため、同じ意味でも英語の2倍以上のコストがかかります。実装上の対策は簡潔です:英語でプロンプトを書き、末尾に「Always respond in Japanese」と指定するだけで、トークン消費が30〜50%削減できます。東工大のベンチマークでも日本語タスクでの精度差が実証されており、システム構築時は英語プロンプト・日本語出力の構成が両面で有利です。