2019年4月 - 2023年3月
多次元構造解析の確立による手書き数式認識の高次化
日本学術振興会 科学研究費助成事業 基盤研究(A) 基盤研究(A)
本研究では,シンボル分割,シンボル認識,位置関係認識のすべてに曖昧性を有する2次元構造の手書き数式を対象に,その構造認識,特にその中核の文脈処理のレベルを飛躍的に高めることを目標にしている.手書き変動が字形だけでなく位置変動にも生じるために,上記のすべてに影響を与える課題である.ただし,手書き数式認識に特化した手法ではなく,汎用性の高い手法を求めている.したがって,手書き数式認識を包含して,より包括的な構造解析的パターン認識の進展を阻んできたノイズを含む多次元構造あるいはグラフ構造の曖昧性解消に資することを目指してきた.
これまでに,すでに有する複数の認識システムを母体に,考えられる複数の方法を試してきた.それらは,ゲート付きのRecurrent Neural Network (RNN)の2次元化,ラベル付き学習パターンの不足を補う半教師付き学習,複数の部分構造にAttentionを払うend-to-endのDNN,最新のTransformerモデルなどである.さらに,学習パターン数を人工的に拡大するために,手書き数式パターンの自動生成手法も研究してきた.また,大学新入試の試行として行われた模擬試験解答パターン6万人×2年分を研究用途に入手し,数式認識方式の学習に供することができた.加えて,数式解答の自動採点や採点支援を見越し,研究計画を先取りして手書き数式のクラスタリングの研究にも着手した.これらの成果をScopusのQ1論文誌であるPattern Recognition Letters 誌に2件,文書解析と認識の最大の国際会議であるInt’l Conf. on Document Analysis and Recognitionとその関連ワークショップなどに8件,電子情報通信学会のPRMU研究会で3件,発表した.
これまでに,すでに有する複数の認識システムを母体に,考えられる複数の方法を試してきた.それらは,ゲート付きのRecurrent Neural Network (RNN)の2次元化,ラベル付き学習パターンの不足を補う半教師付き学習,複数の部分構造にAttentionを払うend-to-endのDNN,最新のTransformerモデルなどである.さらに,学習パターン数を人工的に拡大するために,手書き数式パターンの自動生成手法も研究してきた.また,大学新入試の試行として行われた模擬試験解答パターン6万人×2年分を研究用途に入手し,数式認識方式の学習に供することができた.加えて,数式解答の自動採点や採点支援を見越し,研究計画を先取りして手書き数式のクラスタリングの研究にも着手した.これらの成果をScopusのQ1論文誌であるPattern Recognition Letters 誌に2件,文書解析と認識の最大の国際会議であるInt’l Conf. on Document Analysis and Recognitionとその関連ワークショップなどに8件,電子情報通信学会のPRMU研究会で3件,発表した.
- ID情報
-
- 課題番号 : 19H01117
- 体系的課題番号 : JP19H01117