- トップ
- 企業・教材・サービス
- スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開
2024年5月14日
スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開
東京工業大学、東北大学、富士通 人工知能研究所、理化学研究所、名古屋大学、サイバーエージェント、Kotoba Technologiesは、スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を5月10日に公開した。
深層学習フレームワークを「富岳」に移植してTransformerの性能を「富岳」上で最適化し、並列分散学習手法を開発・適用することで、大規模言語モデルの学習を行う際の演算速度を6倍に高速化した。
さらに、「富岳」向けにTofuインターコネクトD上での集団通信の最適化を行うことにより、通信速度を3倍高速化することに成功。これにより「富岳」のCPUを用いて、現実的な時間内で大規模言語モデルを学習することが可能になったという。
Fugaku-LLMは国内で多く開発されている70億パラメータより高性能、かつ扱いやすい130億パラメータのモデル。学習では、サイバーエージェントが収集した独自の日本語学習データと英語のデータなどを用いているため、日本語性能にも優れ、特に人文社会系のタスクでは高いベンチマーク性能を発揮するという。
Fugaku-LLMは、GitHubやHugging Faceを通じ公開していて、ライセンスに従う限り、研究および商業目的での利用が可能。
関連URL
最新ニュース
- AZWAY、「子どもに留学してほしい国」アンケート結果を公開(2024年11月15日)
- キーパーソン21、キャリア教育体験型授業を横浜市立笹下中学校で開催(2024年11月15日)
- 明治学院大学、大学院Webサイトがリニューアル(2024年11月15日)
- プログラミングスクール「NINJA CODE」、オンラインのローンサービスを導入(2024年11月15日)
- steAm、理・工系分野の女子学生を支援するオンラインイベントを無料開催(2024年11月15日)
- 「全日本ロボット相撲大会2024 決勝大会」12月7日・8日両国国技館で開催(2024年11月15日)
- 東京書籍、教育者向け「学習者用デジタル教科書 体験&授業づくりワークショップ」12月開催(2024年11月15日)
- 学習分析学会、12月14日開催「2024年度第2回JASLA研究会」の発表者募集(2024年11月15日)
- ワンキャリア、人事・採用担当者向け「新卒採用の地図」18日・19日開催(2024年11月15日)
- オープンバッジ・ネットワーク、財団設立5周年記念シンポジウム12月4日開催(2024年11月15日)