2013年4月 - 2017年3月
言語コーパスに対する読文時間付与とその利用
日本学術振興会 科学研究費助成事業 基盤研究(B)
- 課題番号
- 25284083
- 体系的課題番号
- JP25284083
- 担当区分
- 研究代表者
- 配分額
-
- (総額)
- 16,770,000円
- (直接経費)
- 12,900,000円
- (間接経費)
- 3,870,000円
- 資金種別
- 競争的資金
平成25年度は、まず実験環境の構築を行った。対象とするテキストコーパスとして「現代日本語書き言葉均衡コーパス」のコアデータ中の書籍サンプルと新聞サンプルを対象とし、自己ペース読文法の実験環境と、視線走査法の実験環境を構築した。20人規模で自己ペース読文法の被験者実験を、8人規模で視線走査法の被験者実験を行い、実験を大規模に行う際に起きる問題点を検証した。結果、視線走査法において、画面遷移時の注視点の制御について問題があることがわかった。また、被験者の募集が低調であったために、効率的に被験者を募集する手法についても検討を行った。小規模ではあるがデータを収集し、データの構造化を進めた。文字列の線形順序と視線遷移順序の両方を読み時間情報とともに帳票形式で保存する方法を検討した。検索環境構築においては、予算の制約により、予定していた2つのソフトウェアのうちChaKi.NETに対してのみ読文時間対応を行うこととした。平成25年度は現行の ChaKi.NETの機能により、どのレベルの問い合わせと可視化が可能かについての検証を行った。検証においては、分担者との議論だけでなく、第5回コーパス日本語学ワークショップにおけるポスター発表により広く意見を募った。結果、書記言語における文字列の線形順序と人間の読文過程における単語認識順序が、自己ペース読文法においては一致するが、視線走査法においては読み戻しや読み飛ばしが発生し、2つの順序間の対照比較の類型化が必要なことがわかった。
- リンク情報
- ID情報
-
- 課題番号 : 25284083
- 体系的課題番号 : JP25284083