2015年7月6日
凸版印刷/江戸時代以前の”くずし字”をテキストデータ化するサービス
凸版印刷は3日、江戸時代以前に”くずし字”で書かれた古い書物の文字を判別し、テキストデータ化するOCR(光学文字認識)技術を開発したと発表した。この技術を使った古典籍(内容・形態の優れた古い書物のこと)のテキストデータ化サービスを、夏から試験的に開始する予定。
今回発表した技術は、江戸期以前の書物に使われている”くずし字”を自動で判読し、テキストデータ化を可能にするもの。
凸版印刷は、2013年からさまざまな書籍を高い精度でテキストデータ化する「高精度全文テキスト化サービス」を提供。
このサービスで確立したテキストデータ化技術のシステム基盤を、はこだて未来大学の寺沢憲吾准教授が開発した「文書画像検索システム」と組み合わせ、くずし字で記されている古典籍のOCR処理を実現した。
2014年度に実施した検証実験では、くずし字で記されている書物を80%以上の精度でOCR処理することに成功している。
今後、テキストデータ化サービスを開始。その上で、幅広い年代やジャンルの資料に対するOCR処理の精度向上を図っていきながら、教育への普及などにも貢献していきたいとしている。
関連URL
最新ニュース
- ヘッドウォータース、東京都教委開催の「モバイルアプリコンテスト2025」を支援(2026年2月20日)
- ラインズ、茨城県龍ケ崎市で入退室管理システム「安心でんしょばと」一斉導入(2026年2月20日)
- 「教育機関の教員に対する生成AIの利用状況に関する調査 2026」協力依頼(2026年2月20日)
- 小中学生の「文系・理系」進路選択、保護者の7割以上が「特に希望はない」と回答 =LUXGO調べ=(2026年2月20日)
- 小学校入学、年長児保護者の84.5%が「不安あり」と回答 =ベネッセ調べ=(2026年2月20日)
- 金沢工業大学とNVIDIA、AI社会実装や高度情報技術者育成で学術連携協力協定締結(2026年2月20日)
- 中央大学、細胞診に即利用できるスタンドアローンAI診断支援システムを世界初開発(2026年2月20日)
- 九州大学、秀逸な若手研究者を採用する「稲盛フロンティアプログラム」第4期公募開始(2026年2月20日)
- 京都芸術大学、通信教育部がバークリー音楽大学・放送大学の一部科目を単位認定(2026年2月20日)
- mikan、西部台千葉高等学校における「mikan for School」導入事例を公開(2026年2月20日)











