共同研究・競争的資金等の研究課題

2002年 - 2004年

多言語同時処理によるアジア系言語の自然言語翻訳に関する基礎研究

日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

課題番号
14310220
体系的課題番号
JP14310220
配分額
(総額)
15,200,000円
(直接経費)
15,200,000円

1.アジア系言語における多言語音声翻訳実験システムの完成度向上:
前科研(平成12〜13年度)では民間研究所と連携して4言語のデータを提供し、日本語音声入力で各言語の文字出力を実現していた。これを基礎に、音声の同時出力を実現した。この成果を産学官フェアに出展し、産学官協力事例としてマスコミでも紹介された。現在は応用性向上のため、研究の中心を次項にシフトした。
2.電子化レキシコンの構造化と試行的構築:
アジア諸語データを汎用的に構造化された形式で工学系分野に提供するためには、文法統語、言語類型論的情報を埋め込む構造化方式の研究が必要である。この基礎としてGDA(大域文書修飾Global Document Annotation、(独)産業技術総合研究所橋田浩一氏の研究)の研究を重ね、多言語文字データが必要とする追加補足事項の検討を重ね、学外専門家にも批判的検討を求めてきた。現時点では未公開であるが、海外研究者から好意的なコメントを得ている。プレーン・テキストにタグ付けで情報を付加する手法の文学、口承文芸データの分析への応用研究にも取り組んだ。
3.モバイル端末での利用のための技術的検討:
大阪府立研究所の研究者との共同研究として、次世代携帯端末での多言語データ応用するアプリケーションの開発に取り組み、文字表示の改良、音声データ出力の基礎技術を完成させた。
4.基礎語彙および多言語会話データの集積と完成度向上:
同一テキストのアジア諸語による文字・音声データ構築は、前科研を継続して言語数は14言語に達した。海外研究者も対象言語の規模に強い関心を示し高く評価している。成果は早急に公開の予定である。応用研究として、社会の多言語化に貢献するため「多言語図書館案内システム」(10言語)も試験的に構築した。
これらの成果は、産学官フェア、学会発表、ワークショップ等で公開した。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-14310220
ID情報
  • 課題番号 : 14310220
  • 体系的課題番号 : JP14310220

この研究課題の成果一覧

書籍等出版物

  1