日本語タスクに強い LLM はどれか — Claude / GPT / Gemini と国産モデルの実用比較

敬語変換、ビジネスメール起草、契約書要約。日本語のサービスを作るときに本当に問われるのは JLPT 文法ではなく、こうした実務タスクです。Claude Opus 4.7 / Sonnet 4.6、GPT-5.5、Gemini 3.1 Pro/Flash と、Tsuzumi、Sarashina、Llama-3-Swallow など国産 LLM の立ち位置を、実用観点で整理しました。

japanese-languagellm-benchmark