- トップ
- 企業・教材・サービス
- GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
2024年3月13日
GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
GMOメディアは11日、「日本語言語モデルの実践的評価」研究で、IT分野でのLLMの能力差を解明したと発表した。
「大規模言語モデルの日本語実践的評価:JGLUEとIT パスポート試験を用いた比較分析」をテーマとした研究を実施。大規模言語モデル(LLM)が持つ推論能力(正確な解答を導き出す力)や問題解決能力の特徴を分析することで、LLMごとのIT分野における能力差を解明したという。
研究では、複数のLLMに「ITパスポート試験」の過去問を解答させることで、IT分野の問題に対してどの程度正しい解答を導き出すことができるかを評価した。
その結果、「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」は、約70%の精度で正解できた。一方、JGLUE試験のような一般常識問題では高い正答率を出す「Japanese Stable LM Instruct Alpha 7B v2」「nekomata-7b-instruction」は、IT分野は苦手とする傾向が見られた。しかし、解答を補助するヒントを与えることで、ほとんどのLLMで解答の精度が向上した。
IT分野での正確な解答を導き出す力はLLMのモデル間で差異があり、IT分野に関してLLMに質問をする場合は、ある程度有効的に活用できるLLM(「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」)と、活用に注意しなければならないLLMがあることが分かったという。
研究の詳細と結果はコエテコAI教育研究所のページで公開している。
関連URL
最新ニュース
- 豊中市、小学校提出書類をデジタル化、教育DXで保護者の負担軽減と事務効率化へ(2025年12月22日)
- 東京都文京区、闇バイトを擬似体験するゲーム「レイの失踪」で区民向け情報リテラシー教育(2025年12月22日)
- 教員の学ぶ機会と生活の保障に関する教職員アンケート結果を公開 =School Voice Project調べ=(2025年12月22日)
- 中高生の学習スタイル、約6割が「オンラインでつながる仲間の存在が受験勉強の支えになる」 =ベネッセコーポレーション調べ=(2025年12月22日)
- 家庭学習で「デジタルデバイス上への手書き」を行う中高生は約3割 =コクヨ調べ=(2025年12月22日)
- 大学受験期のクリスマス、6割以上が「特別なことは何もしなかった」 =Studyplusトレンド研究所調べ=(2025年12月22日)
- 子どものスマホ利用 約半数の家庭が「ルールを決めていない」=LINEヤフー調べ=(2025年12月22日)
- 受験期に親が抱えるプレッシャー、子どもの成績より体調管理や金銭面の不安が上回る =明光義塾調べ=(2025年12月22日)
- Biz Hits、文系出身者に聞いた「文系におすすめの職業」ランキング(2025年12月22日)
- 英語を使う業務歴3年以上のビジネスパーソンの英語学習方法は「AI英語学習アプリ」=アイキューブ調べ=(2025年12月22日)











