共同研究・競争的資金等の研究課題

2013年4月 - 2017年3月

言語コーパスに対する読文時間付与とその利用

日本学術振興会  科学研究費助成事業  基盤研究(B)

課題番号
25284083
体系的課題番号
JP25284083
担当区分
研究代表者
配分額
(総額)
16,770,000円
(直接経費)
12,900,000円
(間接経費)
3,870,000円
資金種別
競争的資金

平成25年度は、まず実験環境の構築を行った。対象とするテキストコーパスとして「現代日本語書き言葉均衡コーパス」のコアデータ中の書籍サンプルと新聞サンプルを対象とし、自己ペース読文法の実験環境と、視線走査法の実験環境を構築した。20人規模で自己ペース読文法の被験者実験を、8人規模で視線走査法の被験者実験を行い、実験を大規模に行う際に起きる問題点を検証した。結果、視線走査法において、画面遷移時の注視点の制御について問題があることがわかった。また、被験者の募集が低調であったために、効率的に被験者を募集する手法についても検討を行った。小規模ではあるがデータを収集し、データの構造化を進めた。文字列の線形順序と視線遷移順序の両方を読み時間情報とともに帳票形式で保存する方法を検討した。検索環境構築においては、予算の制約により、予定していた2つのソフトウェアのうちChaKi.NETに対してのみ読文時間対応を行うこととした。平成25年度は現行の ChaKi.NETの機能により、どのレベルの問い合わせと可視化が可能かについての検証を行った。検証においては、分担者との議論だけでなく、第5回コーパス日本語学ワークショップにおけるポスター発表により広く意見を募った。結果、書記言語における文字列の線形順序と人間の読文過程における単語認識順序が、自己ペース読文法においては一致するが、視線走査法においては読み戻しや読み飛ばしが発生し、2つの順序間の対照比較の類型化が必要なことがわかった。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-25284083
URL
http://kaken.nii.ac.jp/d/p/25284083.ja.html
ID情報
  • 課題番号 : 25284083
  • 体系的課題番号 : JP25284083

この研究課題の成果一覧

Works(作品等)

  2
  • Takuya Miyauchi, Masayuki Asahara, Natsuko Nakagawa, Sachi Kato
    2018年 データベース
  • Masayuki Asahara
    2018年 データベース