- トップ
- 企業・教材・サービス
- GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
2024年3月13日
GMOメディア、「日本語言語モデルの実践的評価」研究でIT分野でのLLMの能力差を解明
GMOメディアは11日、「日本語言語モデルの実践的評価」研究で、IT分野でのLLMの能力差を解明したと発表した。
「大規模言語モデルの日本語実践的評価:JGLUEとIT パスポート試験を用いた比較分析」をテーマとした研究を実施。大規模言語モデル(LLM)が持つ推論能力(正確な解答を導き出す力)や問題解決能力の特徴を分析することで、LLMごとのIT分野における能力差を解明したという。
研究では、複数のLLMに「ITパスポート試験」の過去問を解答させることで、IT分野の問題に対してどの程度正しい解答を導き出すことができるかを評価した。
その結果、「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」は、約70%の精度で正解できた。一方、JGLUE試験のような一般常識問題では高い正答率を出す「Japanese Stable LM Instruct Alpha 7B v2」「nekomata-7b-instruction」は、IT分野は苦手とする傾向が見られた。しかし、解答を補助するヒントを与えることで、ほとんどのLLMで解答の精度が向上した。
IT分野での正確な解答を導き出す力はLLMのモデル間で差異があり、IT分野に関してLLMに質問をする場合は、ある程度有効的に活用できるLLM(「gpt-3.5-turbo-1106」「gpt-4-11-6-preview」「ELYZA-japanese-Llama-2-7b-instruct」)と、活用に注意しなければならないLLMがあることが分かったという。
研究の詳細と結果はコエテコAI教育研究所のページで公開している。
関連URL
最新ニュース
- 英語コーチング、受講期間は「6カ月」が最多、1年以上の長期受講者は35.7%=ミツカル英会話調べ=(2026年2月2日)
- 志望大学選び、受験生の31.7%が「高3の秋」に絞り込み =武田塾調べ=(2026年2月2日)
- 情報処理推進機構、「情報セキュリティ10大脅威 2026」を決定(2026年2月2日)
- Z・α世代女子が今年始めたいこと、1位「自分磨き」、2位「留学や資格の勉強」、3位「恋愛」= digdig調べ=(2026年2月2日)
- 千葉工業大、総合科学特論「web3/AI概論」第4期を4月16日から開講(2026年2月2日)
- NTTデータGSLと近畿大学工学部情報学科、共同でデジタル人財を育成(2026年2月2日)
- TERRAISE、惺山高校で校内のコンピュータのみで完結する生成AI環境「ローカルLLM」構築(2026年2月2日)
- イー・ラーニング研究所、下妻第一高等学校附属中で「非認知能力検定」実施(2026年2月2日)
- 小学館、「全国小学生プログラミング大会 ゼロワングランドスラム2025」決勝大会(2026年2月2日)
- コドモン、無料ウェビナー つくば市「地域全体のICT化の進め方」2月27日開催(2026年2月2日)











