共同研究・競争的資金等の研究課題

2003年 - 2005年

音声記号等で表記された言語資料のマークアップとコンピュータ処理(研究分担者)

文部科学省  科学研究費補助金(基盤研究(A))
  • 松村 一登
  • ,
  • 福井 玲
  • ,
  • 千葉 庄寿
  • ,
  • 滝沢 直宏
  • ,
  • 山田 久就
  • ,
  • 畑野 智栄
  • ,
  • 福井 玲

課題番号
15202008
担当区分
連携研究者
配分額
(総額)
20,930,000円
(直接経費)
16,100,000円
(間接経費)
4,830,000円
資金種別
競争的資金

この3年間の研究プロジェクトの第一の目的は,ロシアとその周辺諸国における危機言語をはじめとする少数言語の言語資料を電子化するための方法を研究し,そのための実用的なツールを開発するとともに,実際に少数言語の言語資料を電子化することである。この研究において電子化したのは,アヴァル語(ダゲスタン),イテリメン語(カムチャツカ),ウラル諸語(エストニア語,マリ語,ベプス語)などで,言語資料の大部分は,キリル文字系のアルファベットで表記されたテクスト,ないしは,録音資料を音声記号で転写したものである。このようにして電子化された言語資料は,すべて,Unicode(UTF-8)で入力された。この作業のために,Unicode標準4.0で定義されているすべてのウラル音声記号とキリル文字が実装された高品質のOpenTypeフォント(JLOT-FLuralic)を,海外研究協力者(フィンランド)の協力を得て開発した。また,言語資料のXML文書化のための公開セミナーを開催するなどして,XMLに対する知見も深め,言語資料にXML準拠したマークアップを施して,well-formedなXML文書とすることが実際にできる段階まで到達した。この研究プロジェクトで目的とする言語資料の電子化は,少数言語のコミュニティ(地域方言のコミュニティも含む)の言語使用を記録する営み(language documentati...

リンク情報
URL
http://kaken.nii.ac.jp/d/p/15202008.ja.html