- トップ
- 企業・教材・サービス
- GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
2024年3月13日
GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
GMOメディアは11日、「日本語言語モデルの実践的評価」研究で、IT分野でのLLMの能力差を解明したと発表した。
「大規模言語モデルの日本語実践的評価:JGLUEとIT パスポート試験を用いた比較分析」をテーマとした研究を実施。大規模言語モデル(LLM)が持つ推論能力(正確な解答を導き出す力)や問題解決能力の特徴を分析することで、LLMごとのIT分野における能力差を解明したという。
研究では、複数のLLMに「ITパスポート試験」の過去問を解答させることで、IT分野の問題に対してどの程度正しい解答を導き出すことができるかを評価した。
その結果、「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」は、約70%の精度で正解できた。一方、JGLUE試験のような一般常識問題では高い正答率を出す「Japanese Stable LM Instruct Alpha 7B v2」「nekomata-7b-instruction」は、IT分野は苦手とする傾向が見られた。しかし、解答を補助するヒントを与えることで、ほとんどのLLMで解答の精度が向上した。
IT分野での正確な解答を導き出す力はLLMのモデル間で差異があり、IT分野に関してLLMに質問をする場合は、ある程度有効的に活用できるLLM(「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」)と、活用に注意しなければならないLLMがあることが分かったという。
研究の詳細と結果はコエテコAI教育研究所のページで公開している。
関連URL
最新ニュース
- ヘッドウォータース、東京都教委開催の「モバイルアプリコンテスト2025」を支援(2026年2月20日)
- ラインズ、茨城県龍ケ崎市で入退室管理システム「安心でんしょばと」一斉導入(2026年2月20日)
- 「教育機関の教員に対する生成AIの利用状況に関する調査 2026」協力依頼(2026年2月20日)
- 小中学生の「文系・理系」進路選択、保護者の7割以上が「特に希望はない」と回答 =LUXGO調べ=(2026年2月20日)
- 小学校入学、年長児保護者の84.5%が「不安あり」と回答 =ベネッセ調べ=(2026年2月20日)
- 金沢工業大学とNVIDIA、AI社会実装や高度情報技術者育成で学術連携協力協定締結(2026年2月20日)
- 中央大学、細胞診に即利用できるスタンドアローンAI診断支援システムを世界初開発(2026年2月20日)
- 九州大学、秀逸な若手研究者を採用する「稲盛フロンティアプログラム」第4期公募開始(2026年2月20日)
- 京都芸術大学、通信教育部がバークリー音楽大学・放送大学の一部科目を単位認定(2026年2月20日)
- mikan、西部台千葉高等学校における「mikan for School」導入事例を公開(2026年2月20日)











