雑記帳

雑記帳

日本語学会ポスター発表「日本語にとって連濁は何者なのか —容認性判断調査{を・から}考える—」情報

日本語学会2021年度春季大会でのポスター発表「日本語にとって連濁は何者なのか —容認性判断調査{を・から}考える—」に関する資料などを置いていきます。

要旨

連濁の問題は長い間日本語の音韻研究の中心にあり続けている。だが,ライマンの法則に代 表される各種制約には「例外」が見られ,また,「非文法的」と言えるほどの悪さと言えるか は示されていない。本研究では連濁におけるさまざまな条件や制約を比較した容認性判断調 査を行った結果から,連濁の不適用と適用を区別すべきだということ,連濁の適用による違 反は音韻的に容認不可の範囲にあるものとないものがあるとは必ずしも言えないことを示し た。本研究が音声における文法を考える足がかりとなることを期待している。

ポスターおよび説明動画

ポスターと,その内容を説明する動画になります。長さによって3バージョン分けました。

ポスター

  • こちらからダウンロードしてください

3分バージョン

10分バージョン

1分バージョン

ごめんなさい。半分お遊びです

質疑・コメント用チャット

質疑応答やコメントは音声の他にチャットサービスも利用します。このリンクからサービス(slido)へアクセスしてください。なおチャットは匿名でも名前付きでも構いません。

 

予稿集やデータなど

 

0

researchmapのバージョンアップで失ったもの

2020年2月にこのブログも入っているresearchmapがバージョンアップされました。外部のデータベースを使った業績入力などが簡単になった反面,いくつか(私にとって)残念な部分がありました。それはブログや資料のリダイレクトなしでのURL変更です。

旧バージョンでは執筆したブログがそれなりの数があったおかげか,1週間あたり600から1000近くのアクセスがありました。

多くの場合,キーワード検索でたどり着くというパターンが多かったようで,上位のページもそれを反映しています。

ところが今回のバージョンアップにより,ブログのURLはすべて変更され,前のリンクではリダイレクトもされず単に無効となるだけでした。そのためか,googleでのスコアもおそらく下がり,以前では検索上位に来ていた「word 上線」や「令和 アクセント」ではほとんど引っかからなくなってしまったのです(令和のアクセントを専門的視点からまとめた記事はたぶん僕のが最初)。

こちらで対応する方法もないので,放置して新記事はnoteに書いたりもしていたのですが,とりあえずTwitterに過去の記事をランダムに流すことにしたところ,そこそこのアクセス数に戻ってきました。

実際,アクセス元を見ると,バージョンアップ前はGoogleやYahooの検索結果から来ていたのが,6月はほとんどがTwitterからになりました。

僕としては検索して辿り着いてほしいところはあるので,まだ対処は必要ですが,それは今後じりじりと戻ることを期待するしかないんですかね。なんとなく研究関係はこちらに書いて,他はnoteという使い分けにもなりそうですが。

0

音声データのアノテーション作業を(できるだけ)自動化する手順

私の研究では音声の分析を行うことが多いのですが,そのための下準備として音声ファイルのどこにどんな音があるのかを記録しておく必要があります。その作業を「アノテーション」と言います。アノテーションは大きな単位から次のように分かれます。

発話:お客がたくさん来るから米を6合炊いたんだよ

文節:お客が/たくさん/来るから/米を/6合/炊いたんだよ

モーラ:お・きゃ・く・が・た・く・さ・ん…

音素:o, ky, a, k, u, g, a, t, a, k, u, s, a, N…

どういった単位のアノテーションを付けるかは研究の目的によって異なり,全部を常に付ける必要はありませんし,必要に応じて「ピッチの下降がどこから始まるか」というような情報を加えることもあります。

アノテーションしたものは音声ファイルとは別にテキスト形式で保存することが多いのですが,発話の書き起こしだけでもだいぶ時間がかかります。研究では単独発話(例:「お客がたくさん来るから米を6合炊いたんだよ」を方言に訳してもらう)のほかに談話資料(例:「最近あったちょっと面白かったこと」というテーマで5分ほど話してもらう)を集めますが,これが特に時間がかかります。

特に私のように対象方言が母語に近くない者にとって,書き起こしはその方言を理解する上でとても勉強になるのですが,同時に初期段階のものまで自動化してみたいという欲もあって,いまある無料ツールでできるだけそれを実現してみたので記録として残しておきます。

 なお必要なのは以下のソフトです。

  • Julius (本体と音声認識パッケージ,必須)
  • Python (Praatで読めるようにするには必須)
  • Google Chrome (任意だけどあると便利)
  • Perl (Windowsのみ要インストール)

更新履歴

・無音区間の扱いについて誤りを修正(2020/02/26,23:10)

・無音区間の扱い,漢字かな交じりテキストから転記テキストの手順について補足を追加(2020/02/27,8:44)

・TextGridConverterの説明に誤りがあったので修正(2021/03/09,9:29)

サンプルとして,私が調査している天草市深海地区での自由独話データの冒頭部分の20秒弱を使ってみます。私は次のように書き起こしています。

えーと,今から40年ぐらい前じゃってですばって,あのー,ちょうど,流し,中ですね,流しのときに,あのー,雨がしとしと降っとったっですよ。んで,あのー,ご飯食べとっときもずーっとどっからかなんか知らんばってあのー

おおまかに「音声の文字化」と「文字の音素化&時間情報の付与」という2つのステップがあります。以下,それぞれについて説明します。

 

ステップ1:音声ファイルを文字化する

音声ファイルを文字(漢字かな交じり)に書き起こすツールとして3つ紹介します。

1. Google Cloud Speech-to-Text

Googleが提供しているクラウドの音声認識サービスです。音声ファイルをアップロードすると文字が返ってきます。契約すると月60分まで無料で使えるようです。無料で試すこともできます。

先ほどの音声の書き起こし結果を見ると,方言音声なので厳しいと思ったけど精度はなかなか高いと思います。

今から40年ぐらい前だったです。貼ってあの丁度中止中ですね。流しの時に。
雨がしとしと降っとったんですよあのご飯食べたときもずっとどっからかなんか知らんばってあの

 2. Googleドキュメント

Googleの提供しているオンラインで使えるワープロソフトです。同じくGoogleが提供するブラウザであるChromeを使うと音声入力できるようになります。「ツール」から「音声入力」を開きます。

そしてマイクのアイコンをクリックすると音声入力状態になります。ただ,これはマイクを使うことを想定して作られているので,音声ファイルを入力にするには一手間かける必要があります。

  • Macの場合:
    Soundflowerというソフトをインストールし,マイク(入力)をSoundflower (2ch)に設定する
  • Windowsの場合:
    サウンドの設定から「録音」を開き,「ステレオミキサー」を既定のデバイスとして設定する

これで入力してみた結果が次のものです。こちらもなかなか精度は高いと思います。

今から40年ぐらい前だったです貼ってあのちょうど那珂市中ですね流しの時に雨がしとしと降っとったんですよあのご飯食べた時もずーっとどっからかなんか知らんばってあの

3. Julius

Juliusはコマンドで操作する無料の音声認識ソフトです。コマンドプロンプト(Win)やターミナル(Mac)になじみのない方だとインストールや操作に手間取るかもしれませんが,文字化したファイルに時間情報を付けるときには必ず使うのでこのステップは飛ばさないでください。

インストール

  • Mac:「MacでJulius-v4.5を使って音声認識する」に従ってJulius本体とディクテーションキットをダウンロードしてインストールする。ダウンロードはこの解説どおりでうまく行かないことがあるので公式ページからSource codeと書いてあるファイル(zipかtar.gz)を直接ダウンロードしてインストールする。
  • Windows:公式ページにある「Windows用実行バイナリ」から本体をダウンロードして解凍する。

これでJulius本体と音声認識パッケージのうち標準のディクテーションキットが入ると思います。

実行

ターミナル/コマンドプロンプトを実行してディクテーションキットのディレクトリに行きます。Macで自分のホームの直下にjuliusというディレクトリを作り,その下に本体とパッケージを置いた場合は次のようになります(homeはコンピューターによって異なる)。

$ cd /Users/home/julius/dictation-kit-4.5

そして,次のように入力するとマイクから音声認識することができます。

$ julius -C main.jconf -C am-gmm.jconf -nostrip

音声ファイルを入力するには次のように入力します。

$ julius -C main.jconf -C am-gmm.jconf -nostrip -input rawfile

この結果が次のものですが,正直あまり芳しくありません。

エイプリル ばかり 、 四十 . 〇 倍 弱 で 座っ て 、 あの 、 どうぞ 、 何 か し て 、 中 です ね 、 流し の とき に 、 他 の 応募 、 はみ出し た とたん に せよ 、 解毒 、 あの ご飯 食べ たく て 打つ 音 度 から か なんか 散らばっ て ある の か 。

 これは音声認識のための言語モデル(文法)がマッチしていないことが大きいようです。Juliusのページには日本語話し言葉コーパスをもとにして作った言語モデルもあるのでそれをインストールして実行してみます。すると次のようになります(なおMacでは文字コードを変換する必要があり,次のように命令しました)。

まず話し言葉モデルキットのディレクトリに移動する。

$ cd ./ssr-kit-v4.5

次にファイル入力でjuliusを実行する。

$ julius -C main.jconf -dnnconf main.dnnconf -charconv SJIS UTF-8 -input rawfile

その結果が次のものです。ポーズごとに出力されるので/で切っています。なお「あのー」というフィラーは出力されないようです(調整できそうですが)。

今 から/四十 年 ぐらい 前 ちゃっ て です が あっ て/ちょうど/流し/十 です ね 流し の 時 に/雨 が 一 一 つ 取っ た ん です よ/んで 度 あの 御飯 食べ た 時 も ちょっと どっ から か 何 か 調べ て あの

標準キットよりも改善されていますが,Googleのものに比べるとそこまで精度は高くありません。ただ,言語モデルは自分で改良することもできるので,ある程度その方言の文法のパターンを入れていけば改善できるとは思います(文法モデルの書き方は改めて勉強が必要)。

 

ステップ2:音素単位で時間情報を付ける

次に書き起こされたテキストを入力にして音素単位で時間情報を付けます。音素単位の時間情報というのは例えば「今から」なら/i/, /m/, /a/, /k/, /a/, /r/, /a/という音素がどこからどこまで続くのかという情報です。

この作業はJuliusの音素セグメンテーションキットが必要です。なお,日本語でなければ他のソフトやスクリプトもありますし,Windowsならもう少し選択肢が広がるようです。

Macの場合は解凍してからsegment_julius.plの該当部分(緑の太字)を書き換えます(該当部分はだいたい40〜50行目にあるけどエディタで検索して探す)。以下のページがとても参考になります。

元:

## julius executable
if ($^O =~ /MSWin/){
$juliusbin=".\\bin\\julius-4.3.1.exe";
} else {
$juliusbin="./bin/julius-4.3.1";
}

新:太字部分はterminalで$ which juliusと入力して出てきた場所を入れる。

## julius executable
if ($^O =~ /MSWin/){
$juliusbin=".\\bin\\julius-4.3.1.exe";
} else {
$juliusbin="/usr/local/bin/julius";
}

セグメンテーションには次の2つが必要です。

  • 音声ファイル (16kHz,モノラル)
  • 転記ファイル (テキスト,ひらがな表記)

音声ファイルはAudacityやPraatなどの音声分析ソフトを使えば簡単に変換できると思います。

転記ファイルというのは入力となるテキストファイルのことです。ステップ1で作ったテキストはそのままでは誤分析されたものも多いので,音声を聞きながら手作業で修正していきます。上で示した書き起こしがこれに相当します。

えーと,今から40年ぐらい前じゃってですばって,あのー,ちょうど,流し,中ですね,流しのときに,あのー,雨がしとしと降っとったっですよ。んで,あのー,ご飯食べとっときもずーっとどっからかなんか知らんばってあのー

Juliusの入力は平仮名またはローマ字で表記しておく必要があります。ここでは他の人が読むときの読みやすさを考えて平仮名表記のファイルを用意します。これは漢字かな交じりのテキストを改めて入力してもいいのですがウェブサービス(例えば「ローマ字⇔ひらがな⇔漢字かな交じり文 変換」)もありますし,Pythonのpykakasiライブラリを使うこともできます。これらを使って上の漢字かな交じりテキストを変換すると次のようになります(下のはPythonで変換したもの)。

えーと,いまから40ねんぐらいまえじゃってですばって,あのー,ちょうど,ながし,なかですね,ながしのときに,あのー,あめがしとしとふっとったっですよ。んで,あのー,ごはんしょくべとっときもずーっとどっからかなんかしらんばってあのー

この平仮名の転記ファイルを作るときのポイントは以下の2つです。

  • 長い母音を「ー」にする
  • 長めの無音区間(おおむね300ミリ秒以上?)を" sp "(spの前後に半角スペース)でマークする

このポイントに沿うように修正したのが以下のテキストです。このテキストをwavファイルと同じディレクトリ(仮に /Users/local/dictationとする)に置きます。

えーといまから sp よんじゅーねんぐらいまえじゃったですばってー sp あのー sp ちょーど sp ながし sp ちゅーですね sp ながしのときに sp あのー sp あめがしとしとふっとったっですよ sp んでど sp あのーごはんたべたとっときもずーとどっからかなんかしらんばってあの

そして,セグメンテーションキットのディレクトリに移動して次のように入力します(太字部分はtxtとwavを置いたディレクトリ)。

$ perl segment_julius.pl /Users/local/dictation

これでディレクトリに音素と時間情報の入ったlabという拡張子のファイルができます。

0.0000000 0.0725000 silB
0.0725000 0.3425000 e:
0.3425000 0.4925000 t
0.4925000 0.5325000 o
0.5325000 0.6325000 i
0.6325000 0.7625000 m
0.7625000 0.8225000 a
0.8225000 0.8825000 k
0.8825000 0.9125000 a
0.9125000 0.9525000 r

18.1725000 18.2225000 N
18.2225000 18.2725000 b
18.2725000 18.3425000 a
18.3425000 18.3825000 q
18.3825000 18.4125000 t
18.4125000 18.5925000 e
18.5925000 18.6825000 a
18.6825000 18.7725000 n
18.7725000 18.8825000 o
18.8825000 19.2725000 silE

labファイルは左から開始時間,終了時間,音素という配列です。これをpraatで読めるようにするにはtextgrid形式に変換する必要があります。幸いTextGridConverterというPythonスクリプトが公開されているのでこれを使用して,Pythonを次のように実行します(参考「Praatの音声アノテーション(.TextGrid)を自動生成」)。

$ python convert_label.py /Users/local/dictation

実行すると"change segmentation unit to mora? (default:phoneme) y/n:"と聞かれます。これはモーラ単位に区切るかどうかです。今回は音素単位で区切るので"n"にしておきます。出力された結果をwavと一緒にpraatで開くと次のようになります(冒頭2秒を拡大)。

このように長音や無音区間について必要な処理をすれば初期値としては十分使える状態になっているのが分かるかと思います。あとは手作業で修正を加えることで分析に使えるファイルになると思います。ちなみに音素はsegment_julius.plファイルを編集することで修正できるので,例えばヨンジューを/jonNzju:/にするなどは簡単にできます。もっとも無音区間の扱いについては" sp "を付すことで解決していますが,これでいいのかは検討の余地が大いにあります。例えば日本語話し言葉コーパス(CSJ,国立国語研究所)では0.2秒未満の無音区間に対して<pz>というタグを付与しているのに対して,それを超える無音区間は転記する単位分ける,すなわちファイルを分ける,という処理を行っています。この辺は1ファイルあたりの大きさによる機械的な処理や転記そのものの効率性を勘案して設計開始段階で慎重に考えるべきでしょう。

いずれにせよ,このようにフリーソフトを組み合わせることで効率的な書き起こしと音声アノテーションができるようになると思いますので,ぜひ活用してみてください。

0

大学は先生で選ぶべきか?

小池陽慈さんの記事が発端になって「大学は先生で選べ」みたいな話が盛り上がっていたのでちょっと意見をまとめておきます。
この記事の趣旨をかいつまんで述べておきます。
  • 私大文系の入試が難化しおり,偏差値に基づく大学ランクはもはやあまり参考にならない中で旧来の大学ランクのイメージのまま志望校を選ぶのは良くない
  • 偏差値の高くない大学でもジャンルによっては活躍している先生がいるのだから,これからは大学は自分の学びたいジャンルで活躍している先生で選ぶべきである
  • そのためには新聞のオピニオン欄や話題の新書などに目を通して自分のアンテナの感度を高める必要がある
まずSNSでの反応を見る限り,大学教員以外の反応は上々のような印象を受けました。私はまさに大学の中で働く人になりますが,そういった選び方もあまりお勧めはできないというのが正直な感想になります。以下,その理由を書いていきますが,思いのほか長くなってしまったので1分で分かりたい人向けに概要を先にまとめておきます。
  • 大学を先生で選ぶことにもけっこうリスクがあるので積極的にはお勧めしません
  • 施設,教育内容,専門分野などの選ぶ要素はありますが,それもけっこう難しいです
  • 周囲の学生が勉強する雰囲気になっているという点で大まかに偏差値で考えるのも悪くありません
  • 入学後に自分の勉強したいことに合わせて調整・修正する機会は一定以上の規模の大学ならけっこうあります
  • どの進路でも1年次の成績が大切なので,入学後にがんばりましょう
 
 

大学を先生で選ぶことはちょっと危険

1. 卒業までに受けられる授業の数は限られる

大学の卒業単位は124単位以上です。講義系だと1つの半期開講の授業が2単位なので,卒業までに受ける授業は62個になりますが,これには共通教育(一般教養系や語学)関係の授業や卒論(8単位とかが多い)もあるので実際にはさらに減って,40個程度になると思います。専任教員がいくつの授業を担当するかは大学や学科などで本当に様々ですが,ゼミを含めて5〜8個というあたりが標準的でしょう(10コマとか持ってる人がいるのはよーく存じ上げております)。つまり,専門の授業であっても,1人の先生から習える授業は1〜2割程度となります。
 

2. 専門分野は科目と科目のパッケージでできている

それでも「その先生がやっている専門分野のことだけを学べればいい」という人はいるかもしれません。しかし,ある分野について専門的に学ぶには「一見すると関係ないように思える授業」というのをけっこうたくさん受ける必要があります。これは専門分野というものが体系立っているからに他なりません。多くの場合,大学の専門科目はその分野を大づかみに学ぶ概論科目,前提知識のための入門的な科目,専門的な科目,卒業研究あたりを組み合わせたパッケージ(これをカリキュラムと呼びます)でできています。
 
ある先生の授業を十分理解するためには前提となる科目を受けておく必要があるのですが,特定の先生に期待しすぎた場合にこのようなカリキュラムの持つパッケージ性を疎かにしてしまうのではないかということが危惧されます。
 

3. 人間的な相性など分からない部分はけっこうある

これを言ってはどうしようもないと言われそうですが,先生と人間的に相性が悪いことだって十分にありますし,本などで持ったイメージと実際に授業受けたときのイメージが違うことだってけっこうあると思います。だからといってそうしたときに退学するというのは考えにくいことがほとんどでしょうから,その意味でも1人の先生に依存しすぎるのはあまりお勧めできません。

 

4.  教員が移籍することは珍しくない

大学は公立学校と違って定期異動のような考え方はありません。しかし,様々な事情で所属大学を変える先生は毎年多くいらっしゃいます。極端な話,入学してみたらちょうどその先生がいなくなっていたということは十分にあります。
 
このように,大学を先生で選ぶということは必ずしも良い選択になる保証ができるものではありません。
 
※8/26 17:20追記※
「そもそも高校生が先生を判断できるのか」ということも問題になりそうですが,この点については「早期キャリア教育と自己責任論」といったあたりの話題と関わるので稿を改めたいと思います。
※追記ここまで※
 

じゃあ何で選べばいいの?

こういった(どちらかといえば)ネガティブな記事を書くと代案を求められることが多いです。まず私自身「何かの問題を指摘するときに必ず代案がいる」ということは賛成しません。「間違いを間違いだと指摘すること」だって「ゼロにする」という意味で十分な代案ですから(注:これは仮定の話で小池さんの記事の内容そのものが大きな間違いだということではありません)。
 
この件については他の要因がいくつか思いつかないこともないのですが,やはりけっこう難しいものがあります。いくつかその実例を挙げておきます。
 

施設?

大学には教室だけでなく様々な施設があります。代表的なものとして図書館をあげられるでしょう。ひとまず学生数に対する蔵書数というのはその大学が専門分野に対してどれだけの理解度があるかを見るのに参考になるかもしれません(単なる蔵書数なら学生数に比例することがほとんど)。ただ,自分の専門分野について十分な本が揃っているかまで判断はできないのでその点は考慮しておく必要はあると思います。
 
他にも勉強のための施設としてラーニング・コモンズというのを設置する大学は増えてきています。これは大雑把に言えば1人での勉強に限らずグループ作業したりもできる空間になります。北星の場合,レポート支援などの個別学習セミナーなどをやったりもしてるのですが,施設の特徴は本当に大学によってまちまちで,それを高校生が判断するのは難しいのではないかと思います。
 

教育内容?

良い授業をしている大学を選ぶというのも考え方としてはありえます。これには少人数教育や外部と連携した授業など様々な仕掛けが考えられるでしょう。ただ,施設と同じ話になりますが,少人数教育がどの程度の数の科目で実現できているのか,外部との連携といったときに単なるゲスト講師なのか,自分達で何かプロジェクトに取り組むのかなど多種多様です。その見極めもなかなか難しそうです。
 
ちなみに大人数の講義に比べて少人数の授業はグループで取り組むような授業スタイルになることが多いので「やった感」が出やすいのですが,大人数の講義の方が知識として得られるものが多いです(少人数では「深く学べる」という反論もありますがこの辺については機を改めて)。

 

専門分野?

私自身は「外国人対象の日本語教師になりたい」と思っていたので日本語教育を学べる学科を選んだのですが,職業と結びつく学科ばかりではありません。また,日本語教育について学びたいとしても入ったときのイメージと実際の内容のギャップはけっこう大きなものがあります(だからこそ学ぶ価値がある)。その点はぜひ覚悟しておく必要はあるだろうと思います。
 

志望校はガチャ?

色々な要因をあげてはそれがいかに「難しい」かを書いているのですが,これだと志望校選びはガチャのようなものなの?と思われるかもしれません。その指摘はけっこう当たっているんじゃないかと思います。でもそれは別に不幸なことにはならないと思います。だいたいのケースで自分のイメージと違ったからといってそこで腐らずしっかり勉強すればそれなりに力は付きますし,実際大学の成績がよければ(多くの人が心配する)就職でもまず悪い結果にはなりにくいです。例えば,田澤実・梅崎修(2012)「大学難易度と学業成績が就職活動の開始時期,活動量,活動結果に与える影響 : 全国の文系学部の大学生を対象にして」(法政大学キャリアデザイン学部紀要)によれば次のような結果があるそうです。
  • 梅崎(2004):学業成績が高ければ高いほど最終的に就職した企業の志望順位が上がる
  • 永野(2004):大学の入試難易度が高いほど,また,学業成績が高いほど就職活動の自己評価点が高い
  • 平沢(2010):就職活動結果の多くの指標において大学分類などを統 制したうえで成績の正の効果がある
  • 濱中(2007):入試難易度の高くない大学(偏差値 56 以下)に おいては,学業成績が良いことが内定獲得時期を早める効果を示すものの,いわゆる旧帝大などの国立大学および入試難易度の高い私立大学(偏差値 57 以上)では、その効果が見られなかった
さらに,大学4年間の成績に影響する要因として強いのは入学時の成績ではなく,1年次の成績であることが例えば東京理科大学総合教育機構教育開発センターの研究などで示されています。
 
じゃあ志望校選びはくじ引きで決めてしまっていいのかなどと言われるとそれもちょっと違うところがあります。
 

大学の規模は修正の機会でもある

自分のやりたかったことと大学の間でイメージと違うとき,そこでそのまま頑張るという選択肢もありますし,それを可能な限り修正するという選択もあっていいとは思います。そのときにとれる選択肢としては,例えば正規の専攻の他にも副専攻を設けているところがあったりしますし,学科の垣根を越えた留学制度を整えているところもあるでしょう。もし完全に分野を変えたいときには同じ大学でしたら転学科(もちろん試験がある)の制度も考えられます。そういった諸制度を活用しても良いですし,大学の中には正規の授業の他に勉強会や自主ゼミが開かれていることがあります(危険な宗教系団体もあるのでやや注意が必要だけど)。
 
これについては大学の規模が大きければそういった制度も多くなるので,その意味でこれは人数が多い方が可能性もあるという話と捉えてもいいと思います(もちろん小さい大学でも探せばあると思いますし,だから小規模校はダメという意味でもありません)。
 

偏差値は万能ではないがちょっとした基準にはなる

上では教員,施設,教育内容などの話が中心になっていますが,学生そのものというのもけっこう重要な要因じゃないかと思っています。これは「話が合う」みたいなものではなく,ひとまず周りの学生が「足を引っ張るような人ではなければいい」というものです。残念なことに世の中には「真面目に勉強する」ことを揶揄する人ってのは一定数います。そしてそういう人だって大学生になっていることがあり,多ければ多いだけ自分1人で頑張って勉強することはハードになっていきます。
 
しかしそういう人達は一定以上の学力(偏差値)になるとグッと減ります(ゼロになるとは言わないけど)。その意味で僕の書いた「足を引っ張る人が少ないところ」というのはそれなりの偏差値を意味すると考えてもらって構いません。それじゃあ偏差値によって志望校を選ぶのが良いのか?となるのですが,そうでもありません。私自身は「高偏差値大への入学がその後の人生を保証する」みたいな価値観には与しませんし,この記事の主旨もそこにはありません。あくまで大まかな選択においてということです。リスクを減らすという意味で,偏差値が10とか違ったら上の偏差値のところにするというのは否定しない方が良いかと思います。
 

上にも書いたとおり「大学時代での高成績は就職に好影響」なのですから,原則は入った後にどれだけ頑張るかではあると思います。進路選択は本当に難しいものだと思います。たとえ進路先が入学前のイメージと違っても,または入学前に自分の進路先が第一志望じゃなくても,上で書いたようなことを踏まえて幸せな大学生活を送ってもらえたら幸いです。

0

Praatでモーラ・音節ごとのF0を抽出する方法

リクエストがあったのでついでにブログ記事にしておきます。Praatを使って単語に含まれる音節やモーラのF0を抽出することがあります。私自身も著書(もっと売れてくれ!)の第2章などでモーラ単位でF0を抽出して分析しています。この作業をもう少し正確に言えば,モーラを10等分し,それぞれのポイントのF0を計測することになります。そのため必然的にF0は時間単位で正規化されることになります。以下では私の作成したスクリプトを使って具体的な方法を解説します。ちなみにタイトルはモーラ・音節としていますが,単語・文節についても同様に分析可能です。その場合は切る数を増やした方がいいと思います。

使用するスクリプトは以下のものです(資料公開に置いてあります)。
※更新履歴
  • 2019/07/05
    • 音声ファイル名をA列に表示させて整然データになるようにした
    • 音声ファイル間に空行が入らないようにした
    • 行末の空白セルをなくした

用意するもの

以下の2つを同じディレクトリ(フォルダ)に置いてください。なお,ファイル名は2つとも同じにしてください。
  • 音声ファイル
  • テキストグリッド(音節・モーラ単位で切ってあること)
サンプルのための音声ファイルとテキストグリッドを圧縮しておいておきます。
ちなみにモーラ単位でラベリングをするときに子音部分を含めると子音そのものの時間長が正規化にとって厄介なことになるので母音部分だけラベルを付けています。

使用方法

スクリプトの拡張子をTXTからpraatに変更してPraatで開いてRunで実行すると以下の画面が出ます。

  • Directory…ファイルを置いているディレクトリを指定
  • Base file name…例えば分析するファイルを限定したいときファイル名の最初に"Mat-"などを付けておきここでそれを指定すると分析するファイルがそれに限られます。何もなければ空欄
  • number of frame…モーラ・音節をいくつに切るかを指定
  • The name of result file…結果を出力するファイルの名前を指定
これで実行するとデフォルトではF0_list.txtというファイルに分析結果が出てきます。このファイルはタブ区切りになっていて,コピー&ペーストしてエクセルで読み込むと次のようになります。


各列の内容は次のとおりです。
  • A列…ファイル名
  • B列…tier(モーラ)のラベル
  • C列…tier内のフレーム番号
  • D列はF0値(フレーム内の平均値)
サンプルには3回分の音声とテキストグリッドを入れているので分析結果も3つ分あります。例えばこれの平均を出せば時間単位で正規化したF0(time-normalized F0)のグラフを作成できます。

0