2020年8月20日
一橋大、「基本統計量に基づいた度数別数値パターン検索」にオラクルを活用
日本オラクルは18日、一橋大学が、学術研究・高等教育のための公的統計ミクロデータ利用の促進の一環として、小・中・高での統計教育の推進に向けて同大学が開発した「基本統計量に基づいた度数別数値パターンデータベース」を「Oracle Autonomous Data Warehouse」で、Web上でのデータ検索環境を「Oracle Application Express(APEX)」で構築したことを発表した。
同大学は、統計センターと連携協力協定を締結し、日本の公的統計並びに学術研究の発展、及び振興に寄与する活動を行っている。その活動の一つに、学内にオンサイト施設を設置し、公的統計ミクロデータの利用(オンサイト利用)環境の提供があるという。
オンサイト利用においては、利用者は統計調査の調査票情報を利用して、探索的な研究が行えるが、この審査については、EES Net SDCと呼ばれる文書を元に総務省で策定されたガイドラインに基づいて行われている。
一橋大学の行った「基本統計量に基づいた度数別数値パターン検索」の研究開発では、このガイドラインに加え、データの持ち出しが安全か否かを平均、分散、歪度および尖度などの基本統計量を利用して判定可能か検証。この研究で使用した基本統計量の検索および活用の手法は、小・中・高での統計教育に興味を持つきっかけとなることから、データ検索環境を一橋大学経済研究所のWeb上で6月から公開。
この研究では、1510億の基本統計量と約2億件にもおよぶ数値パターン(無限にある実数を有限化することで得られる値)を検索し回答を得るシステムを、限られた人員、予算内で構築する必要があった。当初、一橋大学では、高性能ワークステーションで稼働する他社データベースでこのデータの処理と抽出を試みたが、性能上検索結果を得ることができないという問題に直面し、性能、運用管理およびコストの要件に合ったシステムを検討。
「Oracle Autonomous Data Warehouse」で検証したところ、これまで全く抽出できなかったデータ検索が実行できる性能を得られただけでなく、アジャイル開発基盤での迅速なUI設計・開発が可能であること、自律機能による運用管理の負担軽減、暗号化によるデータ・セキュリティなどの今後の運用や外部公開におけるメリットを評価し、「Oracle Autonomous Data Warehouse」の導入を決定。
今回の研究開発では、「Oracle Autonomous Data Warehouse」のパーティショニング機能により1510億件ある基本統計量を 分散処理し、2TB以上あったデータに対して圧縮機能を活用することで、最小限のリソースでも高い性能を実現。
同大学では、「Oracle Autonomous Data Warehouse」の採用を機に、同大学で手掛ける他のプロジェクトでも利用を開始。高性能かつ運用負担を軽減できるだけでなく、「Oracle Autonomous Data Warehouse」で利用可能な「Oracle Data Visualization」で簡単にデータの可視化を実現できることから、同大学で行っているカンボジア政府統計調査の支援活動等、様々な統計データの利用促進に活用しているという。
関連URL
最新ニュース
- みんがく、自治体向け「無償スタート応援!教育特化型の生成AI活用キャンペーン」開始(2025年3月14日)
- 教育ネット、タイピング大会 実証自治体を限定10自治体募集(2025年3月14日)
- アローリンク、長野県が「Liny」を活用し「ながの子育て家庭優待パスポート」をリニューアル(2025年3月14日)
- ChatGPTなどの対話型生成AI、「学校で利用したことがある」小学生は16.8%、高校生は27.7% =学研調べ=(2025年3月14日)
- 6割強の親が「老後の備えより子どもの教育費にお金を回したい」と回答 =ソニー生命調べ=(2025年3月14日)
- 「大人になって学んでおけばよかった」No.1は「金融知識」 =日本こどもの生き抜く力育成協会調べ=(2025年3月14日)
- 通信制高校の選択、約6割は子供自身の意思で進学を決定 =ウェブクルー調べ=(2025年3月14日)
- 放課後NPOアフタースクール、「共働き世帯の小学生の放課後の過ごし方」調査結果(2025年3月14日)
- サイボウズ、ソーシャルデザインラボ「不登校・行き渋りに関するインタビュー調査」(2025年3月14日)
- キズキ、「不登校保護者の夫婦関係」のアンケートを実施(2025年3月14日)