- トップ
- 企業・教材・サービス
- GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
2024年3月13日
GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
GMOメディアは11日、「日本語言語モデルの実践的評価」研究で、IT分野でのLLMの能力差を解明したと発表した。
「大規模言語モデルの日本語実践的評価:JGLUEとIT パスポート試験を用いた比較分析」をテーマとした研究を実施。大規模言語モデル(LLM)が持つ推論能力(正確な解答を導き出す力)や問題解決能力の特徴を分析することで、LLMごとのIT分野における能力差を解明したという。
研究では、複数のLLMに「ITパスポート試験」の過去問を解答させることで、IT分野の問題に対してどの程度正しい解答を導き出すことができるかを評価した。
その結果、「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」は、約70%の精度で正解できた。一方、JGLUE試験のような一般常識問題では高い正答率を出す「Japanese Stable LM Instruct Alpha 7B v2」「nekomata-7b-instruction」は、IT分野は苦手とする傾向が見られた。しかし、解答を補助するヒントを与えることで、ほとんどのLLMで解答の精度が向上した。
IT分野での正確な解答を導き出す力はLLMのモデル間で差異があり、IT分野に関してLLMに質問をする場合は、ある程度有効的に活用できるLLM(「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」)と、活用に注意しなければならないLLMがあることが分かったという。
研究の詳細と結果はコエテコAI教育研究所のページで公開している。
関連URL
最新ニュース
- JMC、東京都千代田区「区立小中学校ICT学校教育システムの構築・サポート・保守業務」を受託(2026年5月15日)
- 政府目標「理系5割」実現への道筋は幼少期のSTEAM教育、中学生以上の半数超、高校生以上では7割超が理系を選択 =ヒューマン調べ=(2026年5月15日)
- 小学校教師・保育者・保護者三者相互の「見えない意識のすれ違い」が明らかに =小学館調べ=(2026年5月15日)
- 「これって五月病かも?」5月に感じやすい心の体の不調をアンケート調査 =ナビット調べ=(2026年5月15日)
- 中学受験、保護者の92%が「後悔なし」と回答 =塾選調べ=(2026年5月15日)
- 医学部合格者はいつから本気で勉強した?=武田塾医進館調べ=(2026年5月15日)
- 京都橘大学、文部科学省「数理・データサイエンス・AI教育プログラム」応用基礎レベル+に認定(2026年5月15日)
- 富山商高、記憶のプラットフォーム「Monoxer」活用で外部模試「漢字・語彙」で学年平均点9割超を達成(2026年5月15日)
- バッファロー、一関高専へのWi-Fi 6E対応アクセスポイントなど導入事例を公開(2026年5月15日)
- 京都電子計算、大学と共創する「デジタル絵馬」2027年度入試合格祈願絵馬の受付開始(2026年5月15日)











