2024年4月24日
モルフォAIソリューションズ、東京大学とAI-OCRを活用した研究開発を開始
モルフォは22日、グループ会社のモルフォAIソリューションズ(モルフォAIS)が東京大学とともに、「デーヴァナーガリー文字OCRの実用化と文献データベースの利活用にむけた応用研究」に向けて、AI-OCRを活用した研究開発を開始したことを発表した。

モルフォAISは、2022年7月1日より大学図書館・地方図書館・自治体からのデジタル田園都市構想を背景としたデジタルアーカイブ事業や読書バリアフリー法対応のニーズを受け、市販AI-OCRソフトとして近代書籍対応の「FROG AI-OCR」を提供してきた。
今回、AI-OCRの開発や導入ノウハウを有するモルフォAISとサンスクリット文献学の専門的知識を有する東京大学が共同でAI-OCRを開発し、サンスクリット文献に使用されているデーヴァナーガリー文字のテキストデータベース化を加速させる研究に取り組んだ。
同研究「デーヴァナーガリー文字OCRの実用化と文献データベースの利活用にむけた応用研究」では、デーヴァナーガリー文字を読み取るための光学文字認識(OCR)ソフトウェアの開発と実用化を目指し、そのOCRを用いて読み取ったサンスクリット文献群のデータベースを利活用するための応用研究を行う。
デーヴァナーガリー文字とは、ヒンディー語、マラーティー語、ネパール語などの現代語のみならず、インド圏の文化や歴史などについて多くの史資料を残すサンスクリット語の表記のための主要な文字として使用されてきたインド系文字の一つ。他の人文系分野同様、サンスクリット文献学の分野においても文献のデジタルアーカイブ化やテキストデータベース化は最重要課題であり、これまでも世界各国で様々なプロジェクトが展開されてきた。
しかし、これらのプロジェクトはいずれも手作業によるデータ化が中心であり、個々の研究者の多大な時間と労力を要している状況。
こうした状況を踏まえ、これまで手作業で行われてきたテキストデータ採取の方法を自動化するため、同研究では「FROG AI-OCR」のコアエンジンとして利用している国立国会図書館のNDLOCR(国立国会図書館がCC-BY-4.0のライセンスで公開しているもの)を改良することで、デーヴァナーガリー文字のOCRテキスト化を可能とした。
現在は、その読み取り結果を検証してOCRの精度を改善する研究段階となるが、最終的には手作業での転記や修正作業の手間を大幅に削減することを目指している。
関連URL
最新ニュース
- 全国の学校施設づくり関係者と文科省がフラットにつながる「CO-SHA Slack コミュニティ」始動(2025年12月19日)
- eスタジアム、和歌山県主催・第2回「和歌山県高校eスポーツ選手権2026」に参画(2025年12月19日)
- 習い事や学習塾、8割以上の親が「子どもの成長につながった」と実感 =イー・ラーニング研究所調べ=(2025年12月19日)
- 子どもの新年の目標・抱負、8割以上の親が「達成のために助言や手助けをした」=栄光ゼミ調べ=(2025年12月19日)
- Biz Hits、理系出身者に聞いた「理系におすすめの職業」ランキング(2025年12月19日)
- デジタルハリウッド、neoAIと共同開発した壁打ちチューターAI「Ututor」が「生成AI大賞2025」優秀賞受賞(2025年12月19日)
- FC今治高校×三菱電機、「未来の理系人財」育成プロジェクトで共創ワークショップ開催(2025年12月19日)
- ARI、長岡技術科学大学でAIを使いこなす視点を学ぶ「キャリア形成研修」実施(2025年12月19日)
- 日本数学検定協会、「すらら国際デジタル算数/数学コンテスト2025」に数検3級から8級の英語版の問題提供(2025年12月19日)
- わけわけ、子どもの我流プログラミングを本物の教養へ変える「ゲームクリエイター探究講座」オンライン説明会開催(2025年12月19日)











