2004年 - 2006年
話し言葉コーパスに基づく言語変異現象の定量的分析
文部科学省 科学研究費補助金(基盤研究(B)) 基盤研究(B)
当初の計画に従って、研究期間の前半ではデータの整備をおこなった。具体的には以下のデータを新規に生成した。また既存のデータのエラー修正も実施した。
1.『日本語話し言葉コーパス』コア部分(約44万語)について、韻律情報その他をアクセント句単位に再編成した韻律研究用XMLデータを設計し、作成した(担当:菊池)。
2.『日本語話し言葉コーパス』の異なり語(約4万語)に対して、和語、漢語、外来語等の語種情報を付与した(小椋)。
3.『日本語話し言葉コーパス』からガ行鼻濁音を含みうる語を文脈とともに切り出した鼻濁音研究用データベースを作成した(前川・日比谷)。
4.『日本語話し言葉コーパス』全体(約752万語)を対照として、語形の変異現象を包括的に記録した語形変異研究用RDBを整備した(前川)。
これらのデータを利用して、『日本語話し言葉コーパス』に記録された各種の言語変異現象の研究を実施した。具体的には以下の現象を分析した。
1.母音の無声化(前川・菊池)
2.母音の非語彙的延長(伝)
3.助詞の撥音化(小磯)
4.ガ行鼻濁音(日比谷)
5.語形変異(前川)
6.アクセント句末イントネーションのうち上昇調の変異(前川・菊池)
7.文末の文体的特徴(小椋)
研究成果は国際学会を含む各種学会で報告した他、3年分の成果をまとめた報告書(252頁)を刊行した
1.『日本語話し言葉コーパス』コア部分(約44万語)について、韻律情報その他をアクセント句単位に再編成した韻律研究用XMLデータを設計し、作成した(担当:菊池)。
2.『日本語話し言葉コーパス』の異なり語(約4万語)に対して、和語、漢語、外来語等の語種情報を付与した(小椋)。
3.『日本語話し言葉コーパス』からガ行鼻濁音を含みうる語を文脈とともに切り出した鼻濁音研究用データベースを作成した(前川・日比谷)。
4.『日本語話し言葉コーパス』全体(約752万語)を対照として、語形の変異現象を包括的に記録した語形変異研究用RDBを整備した(前川)。
これらのデータを利用して、『日本語話し言葉コーパス』に記録された各種の言語変異現象の研究を実施した。具体的には以下の現象を分析した。
1.母音の無声化(前川・菊池)
2.母音の非語彙的延長(伝)
3.助詞の撥音化(小磯)
4.ガ行鼻濁音(日比谷)
5.語形変異(前川)
6.アクセント句末イントネーションのうち上昇調の変異(前川・菊池)
7.文末の文体的特徴(小椋)
研究成果は国際学会を含む各種学会で報告した他、3年分の成果をまとめた報告書(252頁)を刊行した
- ID情報
-
- 課題番号 : 16320060
- 体系的課題番号 : JP16320060