嵯峨山茂樹

J-GLOBALへ         更新日: 18/09/14 14:50
 
アバター
研究者氏名
嵯峨山茂樹
 
サガヤマ シゲキ
ハンドル
sagayama
eメール
sagayamameiji.ac.jp
URL
https://ja.wikipedia.org/wiki/%E5%B5%AF%E5%B3%A8%E5%B1%B1%E8%8C%82%E6%A8%B9
所属
明治大学
部署
総合数理学部 先端メディアサイエンス学科 / 大学院 先端数理科学研究科 先端メディアサイエンス専攻
職名
教授(専任)
学位
博士(工学)
その他の所属
東京大学 名誉教授 (旧:大学院情報理工学系研究科システム情報学専攻教授)国立情報学研究所
科研費研究者番号
00303321

プロフィール

兵庫県生まれ。1974年、東京大学 大学院工学系研究科計数工学専攻 修士課程修了。同年、日本電信電話公社に入社、武蔵野電気通信研究所にて音声情報処理の研究に従事。 1990年、ATR自動翻訳電話研究所に移り、自動翻訳電話プロジェクトを遂行。1993年より、NTT ヒューマンインタフェース研究所にて音声認識・合成・対話の研究開発に従事。1998年より、北陸先端科学技術大学院大学教授。2000年より、東京大学教授。2001年より、同大学院情報理工学系研究科教授。2013年、国立情報学研究所特任教授。2014年より、明治大学総合数理学部教授。博士(工学)。専門は、音声・音楽・音響の信号処理と情報処理、文字・画像のパターン処理。

研究分野

 
 
  • 情報学 / 情報学基礎理論 / 音声信号処理、音声情報処理、音楽信号処理、音楽情報処理、手書き文字認識、音声対話擬人化エージェント

経歴

 
2014年4月
 - 
現在
明治大学 総合数理学部 先端メディアサイエンス学科 教授
 
2013年4月
 - 
2014年3月
国立情報学研究所 情報学プリンシプル研究系 特任教授
 
2000年4月
 - 
2013年3月
東京大学 大学院情報理工学系研究科システム情報学専攻 教授
 
1998年6月
 - 
2002年3月
北陸先端科学技術大学院大学 情報科学研究科 教授(2000年からは東京大学と併任)
 
1974年4月
 - 
1998年5月
NTTヒューマンインタフェース研究所 音声情報研究部 主幹研究員
 
1990年2月
 - 
1993年3月
ATR自動翻訳電話研究所 音声情報処理研究室 室長
 
1985年4月
 - 
1990年1月
NTTヒューマンインタフェース研究所 音声情報研究部 主幹研究員
 
1974年4月
 - 
1985年3月
日本電信電話公社武蔵野電気通信研究所→ヒューマンインタフェース研究所 (部署:基礎研究部第四研究室→情報科学基礎研究部音声情報処理方式研究室) 社員→研究主任→研究専門調査員→研究専門調査役→主幹研究員
 

学歴

 
1972年5月
 - 
1974年3月
東京大学 工学部 計数工学科(計測工学専修コース)
 
1972年4月
 - 
1974年3月
東京大学 大学院工学系研究科 計数工学専攻修士課程
 

受賞

 
2009年9月
電子情報通信学会 フェロー称号 「音声・音楽・音響信号処理手法の研究開発」
 
2005年5月
情報処理学会 2005年度 論文賞 ``チャネル間相関を用いた多チャネル信号の可逆圧縮符号化,'' 情報処理学会論文誌, Vol.46, No.5, pp.1118-1128, May 2005.
受賞者: 2005年度 情報処理学会 論文賞: 鎌本 優, 守谷健弘, 西本卓也, 嵯峨山茂樹
 
1996年4月
科学技術庁 長官賞 (研究功績者表彰) 「数理的手法による連続音声認識技術の研究」
 
1991年6月
1991年 平成3年度社団法人 発明協会 発明賞 「複合正弦波音声合成法の発明」(特許01226666号 「音声合成装置」)
受賞者: 嵯峨山茂樹、板倉 文忠
 

論文

 
Takeshi Hori,Kazuyuki Nakamura,Shigeki Sagayama
2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017   1312-1315   2017年11月   [査読有り]
Eita Nakamura,Kazuyoshi Yoshii,Shigeki Sagayama
IEEE/ACM Trans. Audio, Speech & Language Processing   25(4) 794-806   2017年   [査読有り]
Gen Hori,Shigeki Sagayama
22nd International Conference on Digital Signal Processing, DSP 2017, London, United Kingdom, August 23-25, 2017   2017-August 1-5   2017年11月   [査読有り]
© 2017 IEEE. We introduce a variant of the Viterbi algorithm termed 'p-Viterbi algorithm' based on the p-norm of a vector of the log transition probabilities. It includes the conventional Viterbi algorithm as well as a variant termed 'minimax Vite...
Yasuhiro Hamada,Nobutaka Ono,Shigeki Sagayama
The 9th ISCA Speech Synthesis Workshop, Sunnyvale, CA, USA, 13-15 September 2016   27-31   2016年   [査読有り]
Hideyuki Tachibana,Yuu Mizuno,Nobutaka Ono,Shigeki Sagayama
JIP   24(3) 482-482   2016年   [査読有り]
Tomohiko Nakamura,Eita Nakamura,Shigeki Sagayama
IEEE/ACM Trans. Audio, Speech & Language Processing   24(2) 339-339   2016年   [査読有り]
Eita Nakamura,Kazuyoshi Yoshii,Shigeki Sagayama
CoRR   abs/1701.08343(4) 794-806   2017年4月   [査読有り]
© 2014 IEEE. In a recent conference paper, we have reported a rhythm transcription method based on a merged-output hidden Markov model (HMM) that explicitly describes the multiple-voice structure of polyphonic music. This model solves a major prob...
Eita Nakamura, Nobutaka Ono, Shigeki Sagayama, Kenji Watanabe
Journal of New Music Research   44(4) 287-304   2015年10月
© 2015 Taylor & Francis.We study indeterminacies in realization of ornaments and how they can be incorporated in a stochastic performance model applicable for music information processing such as score-performance matching. We point out the import...
Nobutaka Ito,Emmanuel Vincent,Tomohiro Nakatani,Nobutaka Ono,Shoko Araki,Shigeki Sagayama
Signal Processing Systems   79(2) 145-157   2015年   [査読有り]
Eita Nakamura,Shigeki Sagayama
Looking Back, Looking Forward: Proceedings of the 41st International Computer Music Conference, ICMC 2015, Denton, TX, USA, September 25 - October 1, 2015      2015年   [査読有り]
Eita Nakamura, Nobutaka Ono, Shigeki Sagayama, Kenji Watanabe
Journal of New Music Research   44(4) 287-304   2015年9月
© 2015 Taylor & Francis We study indeterminacies in realization of ornaments and how they can be incorporated in a stochastic performance model applicable for music information processing such as score-performance matching. We point out the import...
Gen Hori,Shigeki Sagayama
Proceedings of the 17th International Society for Music Information Retrieval Conference, ISMIR 2016, New York City, United States, August 7-11, 2016   448-453   2016年   [査読有り]
Eita Nakamura,Philippe Cuvillier,Arshia Cont,Nobutaka Ono,Shigeki Sagayama
Proceedings of the 16th International Society for Music Information Retrieval Conference, ISMIR 2015, Málaga, Spain, October 26-30, 2015   392-398   2015年   [査読有り]
Tomohiko Nakamura,Eita Nakamura,Shigeki Sagayama
CoRR   abs/1512.07748    2015年   [査読有り]
Toru Taniguchi,Nobutaka Ono,Akinori Kawamura,Shigeki Sagayama
4th Joint Workshop on Hands-free Speech Communication and Microphone Arrays, HSCMA 2014, Villers-les-Nancy, France, May 12-14, 2014   107-111   2014年   [査読有り]
Hideyuki Tachibana,Nobutaka Ono,Shigeki Sagayama
IEEE/ACM Transactions on Audio, Speech & Language Processing   22(1/2) 228-237   2014年   [査読有り]
Eita Nakamura,Nobutaka Ono,Shigeki Sagayama
Proceedings of the 15th International Society for Music Information Retrieval Conference, ISMIR 2014, Taipei, Taiwan, October 27-31, 2014   531-536   2014年   [査読有り]
Hideyuki Tachibana,Nobutaka Ono,Hirokazu Kameoka,Shigeki Sagayama
IEEE/ACM Transactions on Audio, Speech & Language Processing   22(11/12) 2059-2073   2014年   [査読有り]
Gen Hori,Shigeki Sagayama
Music Technology meets Philosophy - From Digital Echos to Virtual Ethos: Joint Proceedings of the 40th International Computer Music Conference, ICMC 2014, and the 11th Sound and Music Computing Conference, SMC 2014, Athens, Greece, September 14-20, 2014   1257-1262   2014年1月   [査読有り]
© 2014 Gen Hori et al. Automatic generation of guitar tablatures for given songs has been one of research interests in music information processing. Furthermore, some of recent studies have attempted automatic arrangement of given songs before tab...
Eita Nakamura,Tomohiko Nakamura,Yasuyuki Saito,Nobutaka Ono,Shigeki Sagayama
CoRR   abs/1404.2313    2014年   [査読有り]
Eita Nakamura,Nobutaka Ono,Yasuyuki Saito,Shigeki Sagayama
Music Technology meets Philosophy - From Digital Echos to Virtual Ethos: Joint Proceedings of the 40th International Computer Music Conference, ICMC 2014, and the 11th Sound and Music Computing Conference, SMC 2014, Athens, Greece, September 14-20, 2014      2014年   [査読有り]
Eita Nakamura,Nobutaka Ono,Shigeki Sagayama,Kenji Watanabe
CoRR   abs/1404.2314    2014年   [査読有り]
堀玄, 齋藤大輔, 嵯峨山茂樹
計量国語学   29(3) 104-106   2013年12月
音楽要素の分解再構成に基づく日本語歌詞からの旋律自動作曲
深山 覚, 中妻 啓, 酒向 慎司, 齋藤 大輔, 西本 卓也, 小野 順貴, 嵯峨山 茂樹
情報処理学会論文誌   54(5) 1-12   2013年5月   [査読有り]
中村栄太, 武田晴登, 山本龍一, 齋藤康之, 酒向慎司, 嵯峨山茂樹
情報処理学会論文誌ジャーナル(Web)   54(4) WEB ONLY 1338-1349   2013年4月
任意箇所への弾き直し・弾き飛ばしを含む演奏に追従可能な楽譜追跡と自動伴奏
中村 栄太, 武田 晴登, 山本 龍一, 齋藤 康之, 酒向 慎司, 嵯峨山 茂樹
情報処理学会論文誌   54(4) 1338-1349   2013年4月   [査読有り]
Input-Output HMM Applied to Automatic Arrangement for Guitars
情報処理学会論文誌   54(4)    2013年4月   [査読有り]
Nobukatsu Hojo,Kota Yoshizato,Hirokazu Kameoka,Daisuke Saito,Shigeki Sagayama
The Eighth ISCA Tutorial and Research Workshop on Speech Synthesis, Barcelona, Spain, August 31-September 2, 2013   129-134   2013年   [査読有り]
Hirokazu Kameoka,Kota Yoshizato,Tatsuma Ishihara,Yasunori Ohishi,Kunio Kashino,Shigeki Sagayama
INTERSPEECH 2013, 14th Annual Conference of the International Speech Communication Association, Lyon, France, August 25-29, 2013   1826-1830   2013年   [査読有り]
Nobutaka Ito,Emmanuel Vincent,Nobutaka Ono,Shigeki Sagayama
IEEE International Workshop on Machine Learning for Signal Processing, MLSP 2013, Southampton, United Kingdom, September 22-25, 2013   1-6   2013年   [査読有り]
Hirokazu Kameoka,Misa Sato,Takuma Ono,Nobutaka Ono,Shigeki Sagayama
IEICE Transactions   E96-A(10) 1928-1937   2013年   [査読有り]
Gen Hori,Hirokazu Kameoka,Shigeki Sagayama
JIP   21(2) 264-271   2013年   [査読有り]
Stanislaw Andrzej Raczynski,Emmanuel Vincent,Shigeki Sagayama
IEEE Transactions on Audio, Speech & Language Processing   21(9) 1830-1840   2013年   [査読有り]
Tatsuma Ishihara,Hirokazu Kameoka,Kota Yoshizato,Daisuke Saito,Shigeki Sagayama
INTERSPEECH 2013, 14th Annual Conference of the International Speech Communication Association, Lyon, France, August 25-29, 2013   1017-1021   2013年   [査読有り]
Masato Tsuchiya,Kazuki Ochiai,Hirokazu Kameoka,Shigeki Sagayama
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2013, Kaohsiung, Taiwan, October 29 - November 1, 2013   1-6   2013年   [査読有り]
浜村 倫行, 入江 文平, 西本 卓也, 小野 順貴, 嵯峨山 茂樹
電子情報通信学会論文誌. D, 情報・システム   95(11) 1962-1972   2012年11月
本論文では高精度なオフライン手書き単語認識のための環境依存HMMに関して議論する.音声認識で広く用いられている環境依存HMMでは,パラメータ共有法として環境クラスタリングとtied-mixtureの二つのアプローチがあり,前者の認識精度の方が高いと報告されている.しかし,手書き単語認識の場合,環境による変動に比べその他変動が大きいため,環境クラスタリングは困難となる.このため,対象に対する先見知識を用いない場合,従来tied-mixtureによるアプローチのみ成功例が報告されている.そこで...
浜村 倫行, 入江 文平, 西本 卓也, 小野 順貴, 嵯峨山 茂樹
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition)   95(11) 1962-1972   2012年11月
浜村 倫行, 入江 文平, 齋藤 大輔, 亀岡 弘和, 嵯峨山 茂樹
電子情報通信学会論文誌. D, 情報・システム   95(11) 1953-1961   2012年11月
本論文では,手書き単語認識の解析的手法と全体的手法をベイズ決定則に基づき統合するフレームワークを提案する.Kittlerらによるproduct rule導出時の式展開を出発点とし,筆者らの先行研究である正規化事後確率比の導出に用いた近似テクニックを応用することで統合後の事後確率の近似計算式を導く.更に,文字分割失敗による近似誤差と特徴間の相関による近似誤差を補正する方法を示す.提案法は事後確率で表された文字認識結果と隠れマルコフモデルの出力であるゆう度を入力とし,事後確率を出力とするため,...
浜村倫行, 入江文平, 西本卓也, 小野順貴, 嵯峨山茂樹
電子情報通信学会論文誌 D   J95-D(11) 1962-1972   2012年11月
浜村倫行, 入江文平, 齋藤大輔, 亀岡弘和, 嵯峨山茂樹
電子情報通信学会論文誌 D   J95-D(11) 1953-1961   2012年11月
嵯峨山 茂樹, 酒向 慎司, 堀 玄, 深山 覚
システム/制御/情報 : システム制御情報学会誌   56(5) 219-225   2012年5月
確率的手法による歌唱曲の自動作曲
嵯峨山 茂樹, 酒向 慎司, 堀玄, 深山 覚
システム/制御/情報(システム制御情報学会誌)   56(5) 219-225   2012年5月   [査読有り][招待有り]
長谷川 隆, 西本 卓也, 小野 順貴, 嵯峨山 茂樹
情報処理学会論文誌   53(3) 1204-1215   2012年3月
本論文では,音楽から受ける「作曲家らしさ」の印象を説明し定量的に測定できる工学的手法を目指して,音楽学における様式分析手法の1つであるラルーらの綜合的様式分析において論じられている様々な定性的特徴に対応する特徴量を提案する.対象データはMIDIデータとし,音の厚み等の音楽的な表現語の意味を解釈し,楽譜情報から計算可能な量を検討する.正準判別分析の作曲家推測精度を求めることにより,提案した特徴量群による特徴空間上で同作曲家の楽曲が近接して配置されていることが,判別分析結果の階層クラスタ分析に...
Takayoshi Oshima,Yutaka Kamamoto,Takehiro Moriya,Nobutaka Ono,Shigeki Sagayama
International Symposium on Communications and Information Technologies, ISCIT 2012, Gold Coast, Australia, October 2-5, 2012   105-109   2012年   [査読有り]
Satoru Fukayama,Daisuke Saito,Shigeki Sagayama
Non-Cochlear Sound: Proceedings of the 38th International Computer Music Conference, ICMC 2012, Ljubljana, Slovenia, September 9-14, 2012      2012年   [査読有り]
Kazuki Ochiai, Hirokazu Kameoka, Shigeki Sagayama
Proc. ICASSP 2012   2012 Vol.1 133-136   2012年   [査読有り]
Dong Yu, Geoffrey E. Hinton, Nelson Morgan, Jen-Tzung Chien, Shigeki Sagayama
IEEE Transactions on Audio, Speech & Language Processing   20(1) 4-6   2012年1月   [招待有り]
Dong Yu,Geoffrey E. Hinton,Nelson Morgan,Jen-Tzung Chien,Shigeki Sagayama
IEEE Transactions on Audio, Speech & Language Processing   20(1) 4-6   2012年   [査読有り]
Hideyuki Tachibana,Hirokazu Kameoka,Nobutaka Ono,Shigeki Sagayama
2012 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2012, Kyoto, Japan, March 25-30, 2012   2012 Vol.1 465-468   2012年   [査読有り]
Takuma Ono,Nobutaka Ono,Shigeki Sagayama
2012 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2012, Kyoto, Japan, March 25-30, 2012   2012 Vol.4 2417-2420   2012年   [査読有り]
Shigeki Matsuda,Naoya Ito,Kosuke Tsujino,Hideki Kashioka,Shigeki Sagayama
INTERSPEECH 2012, 13th Annual Conference of the International Speech Communication Association, Portland, Oregon, USA, September 9-13, 2012   2626-2629   2012年   [査読有り]
Miquel Espi,Masakiyo Fujimoto,Daisuke Saito,Nobutaka Ono,Shigeki Sagayama
2012 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2012, Kyoto, Japan, March 25-30, 2012   2012 Vol.6 4293-4296   2012年   [査読有り]
Hirokazu Kameoka,Kazuki Ochiai,Masahiro Nakano,Masato Tsuchiya,Shigeki Sagayama
Proceedings of the 13th International Society for Music Information Retrieval Conference, ISMIR 2012, Mosteiro S.Bento Da Vitória, Porto, Portugal, October 8-12, 2012   307-312   2012年   [査読有り]
Hirokazu Kameoka,Masahiro Nakano,Kazuki Ochiai,Yutaka Imoto,Kunio Kashino,Shigeki Sagayama
2012 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2012, Kyoto, Japan, March 25-30, 2012   2012 Vol.7 5365-5368   2012年   [査読有り]
Hirokazu Kameoka,Misa Sato,Takuma Ono,Nobutaka Ono,Shigeki Sagayama
IWAENC 2012 - International Workshop on Acoustic Signal Enhancement, Proceedings, RWTH Aachen University, Germany, September 4th - 6th, 2012.      2012年   [査読有り]
Kota Yoshizato,Hirokazu Kameoka,Daisuke Saito,Shigeki Sagayama
INTERSPEECH 2012, 13th Annual Conference of the International Speech Communication Association, Portland, Oregon, USA, September 9-13, 2012   390-393   2012年   [査読有り]
Emiru Tsunoo, George Tzanetakis, Nobutaka Ono, Shigeki Sagayama
IEEE Transactions on Audio, Speech and Language Processing   19(4) 1003-1014   2011年4月
This paper discusses a new approach for clustering sequences of bar-long percussive and bass-line patterns in audio music collections and its application to genre classification. Many musical genres and styles are characterized by two kinds of dis...
Emmanuel Dupoux,Guillaume Beraud-Sudreau,Shigeki Sagayama
Proceedings of the 33th Annual Meeting of the Cognitive Science Society, CogSci 2011, Boston, Massachusetts, USA, July 20-23, 2011      2011年   [査読有り]
Meinard Müller,Daniel P. W. Ellis,Anssi Klapuri,Gaël Richard,Shigeki Sagayama
J. Sel. Topics Signal Processing   5(6) 1085-1087   2011年   [査読有り]
Jun Wu,Emmanuel Vincent,Stanislaw Andrzej Raczynski,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
J. Sel. Topics Signal Processing   5(6) 1124-1132   2011年   [査読有り]
Jonathan Le Roux,Hirokazu Kameoka,Nobutaka Ono,Alain de Cheveigné,Shigeki Sagayama
Speech Communication   53(5) 658-676   2011年   [査読有り]
Jun Wu, Emmanuel Vincent, Stanislaw Andrzej Raczynski, Takuya Nishimoto, Nobutaka Ono, Shigeki Sagayama
IEEE Journal of Selected Topics in Signal Processing   5(6) 1124-1132   2011年10月   [査読有り]
Nobutaka Ito,Hikaru Shimizu,Nobutaka Ono,Shigeki Sagayama
IEEE Transactions on Audio, Speech & Language Processing   19(7) 2101-2110   2011年   [査読有り]
Jun Wu,Shigeki Sagayama
Speech, Sound and Music Processing: Embracing Research in India - 8th International Symposium, CMMR 2011, 20th International Symposium, FRSM 2011, Bhubaneswar, India, March 9-12, 2011, Revised Selected Papers   66-78   2011年   [査読有り]
Jun Wu,Emmanuel Vincent,Stanislaw Andrzej Raczynski,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2011, May 22-27, 2011, Prague Congress Center, Prague, Czech Republic   2011 Vol.1 25-28   2011年   [査読有り]
Ngoc Q. K. Duong,Hideyuki Tachibana,Emmanuel Vincent,Nobutaka Ono,Rémi Gribonval,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2011, May 22-27, 2011, Prague Congress Center, Prague, Czech Republic   2011 Vol.1 205-208   2011年   [査読有り]
Masahiro Nakano,Jonathan Le Roux,Hirokazu Kameoka,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2011, May 22-27, 2011, Prague Congress Center, Prague, Czech Republic   2011 Vol.3 1972-1975   2011年   [査読有り]
Takuho Nakano,Akisato Kimura,Hirokazu Kameoka,Shigeki Miyabe,Shigeki Sagayama,Nobutaka Ono,Kunio Kashino,Takuya Nishimoto
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2011, May 22-27, 2011, Prague Congress Center, Prague, Czech Republic   2011 Vol.3 2380-2383   2011年   [査読有り]
Tomoyuki Hamamura,Bunpei Irie,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
2011 International Conference on Document Analysis and Recognition, ICDAR 2011, Beijing, China, September 18-21, 2011   523-527   2011年   [査読有り]
Miquel Espi,Shigeki Miyabe,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
INTERSPEECH 2011, 12th Annual Conference of the International Speech Communication Association, Florence, Italy, August 27-31, 2011   2613-2616   2011年   [査読有り]
Tae Hun Kim,Satoru Fukayama,Takuya Nishimoto,Shigeki Sagayama
11th International Conference on New Interfaces for Musical Expression, NIME 2011, Oslo, Norway, May 30 - June 1, 2011   96-99   2011年   [査読有り]
Masahiro Nakano,Jonathan Le Roux,Hirokazu Kameoka,Tomohiko Nakamura,Nobutaka Ono,Shigeki Sagayama
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, WASPAA 2011, New Paltz, NY, USA, October 16-19, 2011   325-328   2011年   [査読有り]
Hirokazu Kameoka,Nobutaka Ono,Shigeki Sagayama
IEEE Transactions on Audio, Speech & Language Processing   18(6) 1507-1516   2010年   [査読有り]
Keisuke Hasegawa,Nobutaka Ono,Shigeki Miyabe,Shigeki Sagayama
Latent Variable Analysis and Signal Separation - 9th International Conference, LVA/ICA 2010, St. Malo, France, September 27-30, 2010. Proceedings   6365 57-64   2010年   [査読有り]
Nobutaka Ito,Emmanuel Vincent,Nobutaka Ono,Rémi Gribonval,Shigeki Sagayama
Latent Variable Analysis and Signal Separation - 9th International Conference, LVA/ICA 2010, St. Malo, France, September 27-30, 2010. Proceedings   6365 81-88   2010年   [査読有り]
西亀 健太, 和泉 洋介, 渡部 晋治, 西本 卓也, 小野 順貴, 嵯峨山 茂樹
電子情報通信学会論文誌. D, 情報・システム   J93-D(3) 303-311   2010年3月
本研究では,スパース性に基づくブラインド音源分離を用いた雑音残響下のステレオ入力音声認識手法を提案する.ステレオ入力を前提とした場合,スパース性に基づくブラインド音源分離は,雑音環境下における音声認識のフロントエンドとして有効なアプローチの一つであるが,残響環境下では分離性能が劣化するほか,時間周波数マスキングそのものが,目的とする音声のスペクトルにひずみを引き起こし,認識性能を劣化させてしまう可能性がある.本研究ではまず前者の問題に対し,我々が開発してきた,拡散雑音モデルに基づく最ゆう時...
Jonathan Le Roux,Emmanuel Vincent,Yuu Mizuno,Hirokazu Kameoka,Nobutaka Ono,Shigeki Sagayama
Latent Variable Analysis and Signal Separation - 9th International Conference, LVA/ICA 2010, St. Malo, France, September 27-30, 2010. Proceedings   6365 89-96   2010年   [査読有り]
西亀健太, 和泉洋介, 渡部晋治, 西本卓也, 小野順貴, 嵯峨山茂樹
電子情報通信学会論文誌 D   J93-D(3) 303-311   2010年3月
Masahiro Nakano,Jonathan Le Roux,Hirokazu Kameoka,Yu Kitano,Nobutaka Ono,Shigeki Sagayama
Latent Variable Analysis and Signal Separation - 9th International Conference, LVA/ICA 2010, St. Malo, France, September 27-30, 2010. Proceedings   6365 149-156   2010年   [査読有り]
Emiru Tsunoo,Taichi Akase,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA   2010 Vol.1 265-268   2010年   [査読有り]
Hideyuki Tachibana,Takuma Ono,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA   2010 Vol.1 425-428   2010年   [査読有り]
Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA   2010 Vol.4 2718-2721   2010年   [査読有り]
Nobutaka Ito,Nobutaka Ono,Emmanuel Vincent,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA   2010 Vol.4 2818-2821   2010年   [査読有り]
Yu Kitano,Hirokazu Kameoka,Yosuke Izumi,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA   2010 Vol.6 4122-4125   2010年   [査読有り]
Yushi Ueda,Yuuki Uchiyama,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA   2010 Vol.7 5518-5521   2010年   [査読有り]
Jun Wu,Yu Kitano,Stanislaw Andrzej Raczynski,Shigeki Miyabe,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
ISCA Workshop on Statistical And Perceptual Audition, SAPA 2010, Makuhari, Japan, September 25, 2010   7-12   2010年   [査読有り]
Halfdan Rump,Shigeki Miyabe,Emiru Tsunoo,Nobutaka Ono,Shigeki Sagayama
Proceedings of the 11th International Society for Music Information Retrieval Conference, ISMIR 2010, Utrecht, Netherlands, August 9-13, 2010   87-92   2010年   [査読有り]
Stanislaw Andrzej Raczynski,Emmanuel Vincent,Frédéric Bimbot,Shigeki Sagayama
Proceedings of the 11th International Society for Music Information Retrieval Conference, ISMIR 2010, Utrecht, Netherlands, August 9-13, 2010   363-368   2010年   [査読有り]
Kazuma Murao,Masahiro Nakano,Yu Kitano,Nobutaka Ono,Shigeki Sagayama
Proceedings of the 11th International Society for Music Information Retrieval Conference, ISMIR 2010, Utrecht, Netherlands, August 9-13, 2010   375-380   2010年   [査読有り]
Emmanuel Vincent,Stanislaw Andrzej Raczynski,Nobutaka Ono,Shigeki Sagayama
Proceedings of the 11th International Society for Music Information Retrieval Conference, ISMIR 2010, Utrecht, Netherlands, August 9-13, 2010   662-664   2010年   [査読有り]
Jun Wu,Yu Kitano,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
Entertainment Computing - ICEC 2010, 9th International Conference, ICEC 2010, Seoul, Korea, September 8-11, 2010. Proceedings   6243 416-418   2010年   [査読有り]
Miquel Espi,Shigeki Miyabe,Takuya Nishimoto,Nobutaka Ono,Shigeki Sagayama
2010 IEEE Spoken Language Technology Workshop, SLT 2010, Berkeley, California, USA, December 12-15, 2010   151-156   2010年   [査読有り]
Takuho Nakano,Shigeki Sagayama,Nobutaka Ono,Akisato Kimura,Hirokazu Kameoka,Kunio Kashino
TRECVID 2010 workshop participants notebook papers, Gaithersburg, MD, USA, November 2010      2010年   [査読有り]
Nobutaka Ono,Kenichi Miyamoto,Hirokazu Kameoka,Jonathan Le Roux,Yuuki Uchiyama,Emiru Tsunoo,Takuya Nishimoto,Shigeki Sagayama
Advances in Music Information Retrieval   274 213-236   2010年   [査読有り]
嵯峨山 茂樹, 中妻 啓, 深山 覚, 酒向 慎司, 西本 卓也
オペレーションズ・リサーチ : 経営の科学   54(9) 546-553   2009年9月
本稿では,任意の日本語テキストの持つ韻律に基づき,歌唱曲を自動作曲する手法について解説する.文学作品や自作の詩,ニュースやメールなど,あらゆる日本語テキストをそのまま歌詞として旋律を生成し,歌唱曲として出力する自動作曲システムは,手軽な作曲のツール,音楽の専門知識を持たない人のための作曲補助ツールとして有用であろう.さらに著作権問題の回避としても用途があろう.歌唱曲は歌詞との関連性が求められる.特に高低アクセントを持つ日本語では,発話音声にピッチの高低が付くため,歌詞を朗読する際の韻律と旋...
Emiru Tsunoo,Nobutaka Ono,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2009, 19-24 April 2009, Taipei, Taiwan   185-188   2009年   [査読有り]
Hirokazu Kameoka,Nobutaka Ono,Kunio Kashino,Shigeki Sagayama
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2009, 19-24 April 2009, Taipei, Taiwan   2009 Vol.6 3437-3440   2009年   [査読有り]
亀岡 弘和, 嵯峨山 茂樹
情報処理   50(8) 711-716   2009年8月

Misc

 
林耕平, 高橋登紀夫, 永田晃弘, 嵯峨山茂樹
情報処理学会研究報告(Web)   2018(MUS-119) Vol.2018‐MUS‐119,No.45,1‐5 (WEB ONLY)   2018年6月
小口純矢, 嵯峨山茂樹
情報処理学会研究報告(Web)   2018(MUS-119) Vol.2018‐MUS‐119,No.29,1‐4 (WEB ONLY)   2018年6月
高橋拓椰, 保利武志, WILK Christoph M., 嵯峨山茂樹, 高橋拓椰, 保利武志, WILK Christoph M., 嵯峨山茂樹
情報処理学会研究報告(Web)   2018(MUS-119) Vol.2018‐MUS‐119,No.21,1‐6 (WEB ONLY)   2018年6月
保利武志, 中村和幸, 嵯峨山茂樹
情報処理学会研究報告(Web)   2017(MUS-116) Vol.2017‐MUS‐116,No.12,1‐6 (WEB ONLY)   2017年8月
齋藤康之, 坂井康二, 五十嵐優, 中村栄太, 阿方俊, 嵯峨山茂樹
情報処理学会研究報告(Web)   2018(MUS-119) Vol.2018‐MUS‐119,No.46,1‐6 (WEB ONLY)   2018年6月
堀 松仁, 神山 歩相名, 小橋川 哲, 嵯峨山 茂樹
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   117(517) 63-68   2018年3月
堀 松仁, 神山 歩相名, 小橋川 哲, 嵯峨山 茂樹
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   117(516) 63-68   2018年3月
保利武志, 中村和幸, 嵯峨山茂樹
情報処理学会全国大会講演論文集   80th(2) 2.43‐2.44   2018年3月
川島佑希奈, 堀玄, 嵯峨山茂樹
情報処理学会全国大会講演論文集   80th(2) 2.51‐2.52   2018年3月
田上集, 光本大記, 嵯峨山茂樹
情報処理学会全国大会講演論文集   80th(4) 4.363‐4.364   2018年3月
伊藤綜耶, WILK Christoph M., 嵯峨山茂樹, 嵯峨山茂樹
情報処理学会全国大会講演論文集   80th(2) 2.47‐2.48   2018年3月
堀松仁, 神山歩相名, 小橋川哲, 嵯峨山茂樹
電子情報通信学会技術研究報告   117(516(SIP2017 111-184)) 63‐68   2018年3月
堀 玄, 嵯峨山 茂樹
JSAI大会論文集   2017(0) 1N12-1N12   2017年7月
<p>歌詞コーパスを形態素解析して得られた形態素リスト上の経路探索による自動作詞システムを開発し、歌詞の韻律に基づく自動作曲システムと統合して、自動作詞作曲システム「オルフェウス」として公開中である。本システムは人工知能による芸術創作の事例として各種メディア(NHK、テレビ朝日、日経新聞等)に取り上げられている。稼動中の、word2vecの類似度を利用した経路探索に基づく自動作詞の原理について発表する。</p>
藤井ほのか, 齋藤康之, 嵯峨山茂樹
情報処理学会研究報告(Web)   2017(MUS-115) Vol.2017‐MUS‐115,No.59,1‐6 (WEB ONLY)   2017年6月
光本大記, 濱田康弘, 小野順貴, 小野順貴, 嵯峨山茂樹
情報処理学会研究報告(Web)   2017(MUS-115) Vol.2017‐MUS‐115,No.38,1‐4 (WEB ONLY)   2017年6月
大森陽, 光本大記, 濱田康弘, 嵯峨山茂樹
情報処理学会研究報告(Web)   2017(MUS-115) Vol.2017‐MUS‐115,No.19,1‐5 (WEB ONLY)   2017年6月
保利武志, 中村和幸, 嵯峨山茂樹
情報処理学会研究報告(Web)   2017(MUS-115) Vol.2017‐MUS‐115,No.33,1‐5 (WEB ONLY)   2017年6月
小口純矢, 濱田康弘, 嵯峨山茂樹
情報処理学会研究報告(Web)   2017(MUS-115) Vol.2017‐MUS‐115,No.56,1‐4 (WEB ONLY)   2017年6月
保利武志, 中村和幸, 嵯峨山茂樹
情報処理学会全国大会講演論文集   79th(2) 2.129‐2.130   2017年3月
田上集, 小口純矢, 光本大記, 松原聖人, 嵯峨山茂樹
情報処理学会全国大会講演論文集   79th(4) 4.323‐4.324   2017年3月
小口純矢, 濱田康弘, 嵯峨山茂樹
情報処理学会全国大会講演論文集   79th(2) 2.249‐2.250   2017年3月
大森陽, 光本大記, 濱田康弘, 嵯峨山茂樹
情報処理学会全国大会講演論文集   79th(2) 2.99‐2.100   2017年3月
地曳 はるか, 齋藤 康之, 中村 栄太, 嵯峨山 茂樹
映像情報メディア学会技術報告 = ITE technical report   41(4) 29-32   2017年2月
藤井 ほのか, 齋藤 康之, 嵯峨山 茂樹
映像情報メディア学会技術報告 = ITE technical report   41(4) 25-28   2017年2月
光本大記, 濱田康弘, 嵯峨山茂樹, 小野順貴, 小野順貴
日本音響学会研究発表会講演論文集(CD-ROM)   2016 ROMBUNNO.2‐Q‐24   2016年8月
保利武志, 中村和幸, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2016 ROMBUNNO.2‐8‐1   2016年8月
越智景子, 小野順貴, 小野順貴, 大須賀智子, 大和田啓峰, 児島正樹, 黒田美保, 山末英典, 山末英典, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2016 ROMBUNNO.2‐P‐31   2016年8月
濱田康弘, 小野順貴, 小野順貴, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2016 ROMBUNNO.2‐Q‐30   2016年8月
佐藤陸, 佐藤陸, 中村栄太, 齋藤康之, 阿方俊, 五十嵐優, 嵯峨山茂樹
情報処理学会研究報告(Web)   2016(MUS-112) Vol.2016‐MUS‐112,No.13,1‐6 (WEB ONLY)   2016年7月
保利武志, 中村和幸, 嵯峨山茂樹
情報処理学会研究報告(Web)   2016(MUS-112) Vol.2016‐MUS‐112,No.18,1‐6 (WEB ONLY)   2016年7月
地曳はるか, 齋藤康之, 中村栄太, 嵯峨山茂樹
情報処理学会研究報告(Web)   2016(MUS-112) Vol.2016‐MUS‐112,No.12,1‐5 (WEB ONLY)   2016年7月
齋藤康之, 長野亜美, 佐藤陸, 中村栄太, 阿方俊, 五十嵐優, 嵯峨山茂樹
情報処理学会研究報告(Web)   2016(MUS-112) Vol.2016‐MUS‐112,No.14,2 (WEB ONLY)   2016年7月
長野亜美, 長野亜美, 齋藤康之, 中村栄太, 嵯峨山茂樹
情報処理学会研究報告(Web)   2016(MUS-112) Vol.2016‐MUS‐112,No.17,1‐6 (WEB ONLY)   2016年7月
地曳 はるか, 齋藤 康之, 中村 栄太, 嵯峨山 茂樹
映像情報メディア学会技術報告   40(5) 117-120   2016年2月
本論文では自動譜めくりシステムにおいて,演奏者の譜めくり合図の頷きとリズムノリ動作を判別する方法について議論する.実際のピアノ演奏において演奏者は譜めくり係に頷いて譜めくりの合図を送っていることから,頷き動作をキューとした自動譜めくりを開発した.しかし,頷き動作は譜めくりの合図だけではなくリズムのノリにも含まれる.そのためシステムは譜めくり合図の頷き動作のみ認識する必要がある.そこで頷き動作とリズムノリ動作をサンプリングした結果,頷き動作よりもリズムノリ動作は浅く頷いていることが明らかとな...
篠原一輝, 田澤健斗, 嵯峨山茂樹
情報処理学会研究報告(Web)   2016(MUS-111) Vol.2016‐MUS‐111,No.45,1‐3 (WEB ONLY)   2016年5月
佐藤 陸, 中村 栄太, 齋藤 康之, 阿方 俊, 五十嵐 優, 嵯峨山 茂樹
映像情報メディア学会技術報告   40(5) 29-32   2016年2月
現在の楽譜の主流は,ピアノに限らず五線譜である.五線譜は多数の楽器の楽譜に採用されているものであり,情報量も多い.しかし,五線譜に慣れていない人にとってはその複雑さによって読むのが難しい.タテ線譜は,ピアノ演奏初心者が読譜し易い新しい楽譜であり,五線譜とは異なり簡素で直感的である.従来,タテ線譜は手動で作成されているが,本研究ではこれをSMFからピアノ運指を含めて自動生成する方法について検討する.さらに,SMFの内容に合わせて表示する音階の上限と下限を変えられるようにした.
長野 亜美, 齋藤 康之, 中村 栄太, 嵯峨山 茂樹
映像情報メディア学会技術報告   40(5) 17-20   2016年2月
楽譜に従って,人の演奏に追従して自動的に伴奏パートを演奏するシステムEurydice(ユリディス)は,演奏の生成過程を確率モデルでモデル化することにより,速度変化や弾き間違いがあっても柔軟に追従できる自動伴奏システムである.Eurydiceでは演奏者による入力に基づいてテンポ制御するが,楽譜上で演奏者パートの休止区間では伴奏パートのテンポ制御ができない.本研究では,そのような区間で,鍵のタップ動作による伴奏のテンポ制御について検討した.まず,タップ動作を行う鍵を決定するために,鍵間の距離に...
中村栄太, 小野順貴, 嵯峨山茂樹
情報処理学会研究報告(Web)   2014(MUS-104) VOL.2014-MUS-104,NO.8 (WEB ONLY)-7   2014年8月
多声部のパッセージのリズム採譜を効果的に行う確率モデルに基づくアルゴリズムを提案する.リズム採譜は,演奏から拍子やリズムの構造など音楽的な情報を取り出すために必要である.これは,楽譜の構造とテンポ変動などを含む演奏の時間的構造を同時に扱う必要があるため容易ではないが,隠れマルコフモデル (HMM) を用いて効率的に行える.ポリリズムを持つ様な多声部のパッセージでは,これら両方の構造が複雑であり,リズム採譜はより高度な技術を要する.これらの構造が各声部内では比較的に単純なことに着目し,各声部...
高宗典玄, 亀岡弘和, 嵯峨山茂樹
情報処理学会研究報告(Web)   2014(MUS-104) VOL.2014-MUS-104,NO.7 (WEB ONLY)-6   2014年8月
自動採譜は音楽音響信号から自動でその楽譜を推定する問題であり,大きく分けて,音響信号からどの楽器がいつどの高さの音を鳴らしたかを推定する多重音解析と多重音解析で得られた結果から実際の楽譜を推定するリズム解析の 2 つがある.本研究では,後者のリズム解析に焦点をあて,MIDI 信号から譜面情報の推定する問題を扱う.リズムとテンポの不確定性があるこの問題に対し,それぞれの生成過程を考え,統合的に解くことによりその解決を試みる.ここで,リズムの生成モデルとして 2 次元 PCFG を用い,その解...
清水柚里奈, 菅野沙也, 伊藤貴之, 嵯峨山茂樹
情報処理学会研究報告(Web)   2015(MUS-107) VOL.2015-MUS-107,NO.17 (WEB ONLY)   2015年5月
高宗典玄, 亀岡弘和, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2014 ROMBUNNO.3-5-4-1042   2014年3月
堀 玄, 嵯峨山 茂樹
電子情報通信学会総合大会講演論文集   2015    2015年2月
高宗典玄, 亀岡弘和, 嵯峨山茂樹
情報処理学会研究報告(Web)   2015(MUS-107) VOL.2015-MUS-107,NO.49 (WEB ONLY)   2015年5月
佐藤 陸, 齋藤 康之, 阿方 俊, 嵯峨山 茂樹
映像情報メディア学会技術報告   39(8) 5-8   2015年2月
現在の楽譜の主流は,ピアノに限らず五線譜である.五線譜は多数の楽器の楽譜に採用されているものであり,情報量も多い.しかしながら,五線譜はその複雑さによって読み方に慣れていない人にとっては難しいものとなっている.タテ線譜は,共著者の一人である阿方が提唱している,読譜のしやすい新しい楽譜であり,五線譜とは異なり,簡素で直観的な見た目となっている.2010年から昭和音楽大学でピアノ初心者を対象に,効果について実証実験を重ねている.現在,タテ線譜は手動で作成されているが,本研究ではこれをMIDIフ...
清水柚里奈, 菅野沙也, 伊藤貴之, 嵯峨山茂樹
情報処理学会全国大会講演論文集   77th(2) 2.377-2.378   2015年3月
中村栄太, 小野順貴, 嵯峨山茂樹
情報処理学会研究報告(Web)   2013(MUS-101) VOL.2013-MUS-101,NO.14 (WEB ONLY)-13   2013年12月
合奏曲をピアノ演奏用に自動で編曲する手法の開発を目標とし,ピアノの両手運指モデルの考案およびそれを用いたピアノ用編曲手法の議論を行う.本研究では,合奏曲のピアノ用編曲を,演奏難易度を制約とした原曲に対する忠実さの最適化と捉え,この原理による自動編曲手法を提案する.まず演奏難易度を扱うためにピアノの両手運指に着目し,運指モデルおよびこれに基づく運指決定を議論する.この際,片手の運指モデルを両手運指モデルに拡張し,従来扱うことが難しかった両手同時の運指決定および両手部分離問題を論ずる.次に,原...
堀玄, 嵯峨山茂樹
電子情報通信学会大会講演論文集(CD-ROM)   2015 ROMBUNNO.A-10-15   2015年2月
Shigeki Sagayama, Tomohiko Nakamura, Eita Nakamura, Yasuyuki Saito, Hirokazu Kameoka, Nobutaka Ono
Proceedings of Meetings on Acoustics   21(1)    2014年1月
Toru Taniguchi, Nobutaka Ono, Akinori Kawamura, Shigeki Sagayama, Shigeki Sagayama
2014 4th Joint Workshop on Hands-Free Speech Communication and Microphone Arrays, HSCMA 2014   107-111   2014年1月
This paper proposes online independent vector analysis (IVA) based on an auxiliary-function approach for real-time blind speech separation. A batch auxiliary-function approach is naturally extended with autoregressive approximation of an auxiliary...
北条伸克, 亀岡弘和, 嵯峨山茂樹
電子情報通信学会技術研究報告   113(308(SP2013 71-81)) 13-18   2013年11月
本稿は,高品質なテキスト音声合成を目指し,複合ウェーブレットモデル(composite wavelet model; CMW)と隠れマルコフモデル(hidden Markov model; HMM)の統合モデルに,フォルマント周波数軌跡のモデルを組み込む.ケプストラム特徴量による従来のHMM音声合成方式では,モデル学習時におけるケプストラム特徴量の平均化がスペクトルの周波数方向の平滑化の原因となり,一般にbuzzyな合成音声へ劣化する原因となった.これに対し,フォルマント周波数に相当する特...
Eita Nakamura, Nobutaka Ono, Yasuyuki Saito, Shigeki Sagayama
Proceedings - 40th International Computer Music Conference, ICMC 2014 and 11th Sound and Music Computing Conference, SMC 2014 - Music Technology Meets Philosophy: From Digital Echos to Virtual Ethos   1185-1192   2014年1月
© 2014 Eita Nakamura et al. A score-following algorithm for polyphonic MIDI performances is presented that can handle performance mistakes, ornaments, desynchronized voices, arbitrary repeats and skips. The algorithm is derived from a stochastic p...
深山覚, 齋藤大輔, 嵯峨山茂樹
情報処理学会全国大会講演論文集   75th(2) 2.65-2.66-66   2013年3月
日本語歌詞から歌唱曲を自動作曲する際に旋律の音楽的特徴を制御する方法を議論する。先行研究を用いると、手軽に日本語歌詞からオリジナル歌唱曲が作れる。よりユーザの意向を反映した歌唱曲の作曲のためには、旋律の特徴の制御が重要である。本発表では、まず旋律の作曲が確率的に定式化できることを議論した上で、跳躍進行型(元気のよい)旋律と順次進行型(なめらかな)旋律の作り分け、モチーフを含む旋律の生成が、動的計画法(DP)による音高系列の探索における経路制約によって実現できることを議論する。
土屋政人, 落合和樹, 亀岡弘和, 嵯峨山茂樹
第75回全国大会講演論文集   2013(1) 281-282   2013年3月
自動採譜問題における発話時刻列から元の楽譜を推定するリズム解析の課題は,テンポと音価の間には無限の解釈が存在しうるという不良設定性の高い問題である.人間が音楽を聞く時にその楽譜を想像することができるのは、人間は音楽として常識的なリズムに関する知識を持っており,そういったトップダウンな情報と観測発話時刻列というボトムアップな情報の両側面から総合的に解釈を行っていると考えられる.そこで本研究ではこうした統合的なアプローチを計算機上で実現することを目指し,言語処理の手法をヒントに楽譜でよく使われ...
桐淵大貴, 深山覚, 齋藤大輔, 嵯峨山茂樹
情報処理学会全国大会講演論文集   75th(2) 2.303-2.304-304   2013年3月
日本語歌詞から伴奏付き二重唱を自動作曲する手法について議論する.日本語歌詞から独唱を自動生成する先行研究があるが,さらに二重唱を作曲可能とすることによって,自動生成楽曲の音楽性と多様性を増大させることができる.また独唱作曲に比べ二重唱作曲はより作曲技能を必要とし,自動作曲を行う意義の大きい問題である.本発表では,あらかじめ作曲された第1声部に対して第2声部を生成する問題設定において,2声部間の音楽理論と,第2声部と伴奏の関係についての確率モデルの下で,確率最大となる旋律を動的計画法を用いて...
中村友彦, 中村栄太, 嵯峨山茂樹
情報処理学会全国大会講演論文集   75th(2) 2.283-2.284-284   2013年3月
本研究の目的は,誤りや任意の弾き飛ばし・弾き直しを含む演奏の音響信号を入力とし,伴奏音響信号を同期再生する自動伴奏の実現である.楽譜上の任意の箇所から任意の箇所への弾き飛ばし・弾き直しを含む演奏を追跡する(楽譜追跡)ためには,総音符数の2乗オーダーの計算量が必要となる.そのため我々は,弾き飛ばし・弾き直しの際に短時間の演奏休止が起こりやすいことに着目し,弾き飛ばし・弾き直しの際に短時間の無音区間を含むような演奏の生成過程を考えた.これは,隠れマルコフモデルによりモデル化でき,短時間の無音区...
谷口 徹, 小野 順貴, 河村 聡典, 嵯峨山 茂樹
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   113(27) 121-126   2013年5月
実時間で周波数領域音源分離を行うため,小野が提案した補助関数型独立ベクトル分析に基づく,実時間動作可能なオンラインブラインド音源分離アルゴリズムを提案する.従来のバッチ型の補助関数型独立ベクトル分析における補助変数の更新を,各時刻の自己回帰的な更新により近似することで,オンライン型アルゴリズムを実現している.音声分離実験により,提案法が雑音下など実際の環境にて安定して動作し,高い分離性能を持つことを示した.また,4チャネル入力時のPC上での実装で,計算時間は実時間比0.8程度であり,実応用...
谷口 徹, 小野 順貴, 河村 聡典, 嵯峨山 茂樹
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   113(29) 121-126   2013年5月
実時間で周波数領域音源分離を行うため,小野が提案した補助関数型独立ベクトル分析に基づく,実時間動作可能なオンラインブラインド音源分離アルゴリズムを提案する.従来のバッチ型の補助関数型独立ベクトル分析における補助変数の更新を,各時刻の自己回帰的な更新により近似することで,オンライン型アルゴリズムを実現している.音声分離実験により,提案法が雑音下など実際の環境にて安定して動作し,高い分離性能を持つことを示した.また,4チャネル入力時のPC上での実装で,計算時間は実時間比0.8程度であり,実応用...
谷口徹, 小野順貴, 河村聡典, 嵯峨山茂樹
電子情報通信学会技術研究報告   113(29(SP2013 1-30)) 121-126   2013年5月
実時間で周波数領域音源分離を行うため,小野が提案した補助関数型独立ベクトル分析に基づく,実時間動作可能なオンラインブラインド音源分離アルゴリズムを提案する.従来のバッチ型の補助関数型独立ベクトル分析における補助変数の更新を,各時刻の自己回帰的な更新により近似することで,オンライン型アルゴリズムを実現している.音声分離実験により,提案法が雑音下など実際の環境にて安定して動作し,高い分離性能を持つことを示した.また,4チャネル入力時のPC上での実装で,計算時間は実時間比0.8程度であり,実応用...
北条伸克, 亀岡弘和, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.2-7-13   2013年9月
石原達馬, 吉里幸太, 亀岡弘和, 齋藤大輔, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(20) 1-5   2013年5月
音声の基本周波数(F0)軌跡は,話者性,感情,意図など豊富な非言語情報・パラ言語情報が含まれることが知られており,その分析は重要な課題である.我々は基本周波数軌跡の数理的なモデルの一つである,藤崎モデルのパラメータの生成過程をHMMによりモデル化することで,実測F0軌跡から藤崎モデルのパラメータを推定する手法を開発してきた.本研究では,パラメータ推定精度の向上を目指して,藤崎モデルの指令列には典型的なパターン(テンプレート)が存在するという仮説に基づき,分析のための新しいHMMのトポロジー...
北条伸克, 吉里幸太, 亀岡弘和, 斉藤大輔, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(21) 1-5   2013年5月
本研究では,高品質のテキスト音声合成のため,音声のスペクトル包絡の生成過程を,複合ウェーブレットモデル(Composite Wavelet Model, CWM)と隠れマルコフモデル(Hidden Markov Model, HMM)を統合した確率モデルにより表現しテキスト音声合成システムに用いる.従来のケプストラム特徴量を用いた音声合成では,統計学習時にスペクトル包絡が平均化し,音声品質が劣化する問題点があったが,CWM特徴量を用いた音声合成では,スペクトル包絡ピーク周波数をパラメータと...
橘秀幸, 亀岡弘和, 小野順貴, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(22) 1-6   2013年5月
著者らは従来から音楽信号を調波音と打楽器音とに分離する研究に取り組んでいる.従来のモデルではスペクトログラム上の最近接の時間周波数成分同士の相互作用のみを考慮していたのに対し,本研究では長距離の相互作用を考慮するようにモデルを拡張することの検討を行なった.これにより,従来からのアルゴリズムの若干の高速化に成功した.またこの拡張によって,FitzGeraldらによってなされた関連研究との間の類似性がある程度明らかになることについても述べ,さらに今後の展望について述べる.
中村友彦, 中村栄太, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(40) 1-5   2013年5月
本研究では,楽譜を参照しつつ演奏に伴奏を同期再生する自動伴奏の実現のため,誤りや弾き直し・弾き飛ばし(ジャンプ)を含む演奏に実時間で追従する音響入力楽譜追跡を計算量に着目し議論する.自動伴奏は,演奏者の生演奏を支援するだけでなく練習に対する効用も大きく,その中核技術である楽譜追跡は自動伴奏実現のため重要な課題である.練習中に,ジャンプは演奏者により任意に起こされるうるため,楽譜追跡を行うためには任意のジャンプを扱うことが望ましい.任意のジャンプを扱うと,楽譜追跡の計算量削減が必要となる.そ...
桐淵大貴, 深山覚, 齋藤大輔, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(51) 1-6   2013年5月
日本語歌詞から多重唱を自動作曲する手法と,既存の歌の旋律を多重唱に自動編曲する手法について議論する.多重唱の自動作曲を用いると,多様な表現をもつ楽曲を生成できる.また独唱作曲に比べ多重唱作曲はより高度な作曲技能を必要とするため,自動作曲を行う意義の大きい問題である.本報告では,多重唱が満たすべき要件を局所的な音高間の遷移確率で記述することにより,多重唱の各旋律の作曲を音高列の生起確率最大化問題として定式化できることを議論する.この定式化に基づき確率最大となる旋律を動的計画法を用いて探索する...
伊東直哉, 深山覚, 中村栄太, 齋藤大輔, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(6) ROMBUNNO.MUS-98,NO.23   2013年4月
中村栄太, 齋藤康之, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(6) ROMBUNNO.MUS-98,NO.15   2013年4月
中村栄太, 齋藤康之, 嵯峨山茂樹
研究報告エンタテインメントコンピューティング(EC)   2013(15) 1-6   2013年3月
鍵盤楽器における両手の演奏は,リズムが左右非同期である場合や独立性を持つ声部が合わさった楽譜の場合などに,互いに独立性を持つ.また,ピアノの運指は多くの場合,両手独立に考えられる.これらの場合,楽譜追跡や自動採譜,ピアノ運指決定等を目的とした演奏モデルは,並列した両手の演奏が依存しながら合わさったものとして記述するのが有効である.この際,MIDI 信号としての演奏は同一チャンネルを通して観測されるため,信号分離を含む逆推定が効率的に行えるモデルが必要である.本稿では,この様な鍵盤演奏を記述...
伊東直哉, 深山覚, 中村栄太, 齋藤大輔, 嵯峨山茂樹
研究報告エンタテインメントコンピューティング(EC)   2013(23) 1-6   2013年3月
楽曲構造に基づくテンポ包絡の生成によって人間が演奏しているような演奏を生成する演奏表情付け法を提案するとともに,その楽曲構造の自動解析を楽譜からの類似箇所検出問題として定式化した.本報告では,音楽学で言及されている演奏表情の階層性に基づいてフレーズ構造に基づく演奏表情に着目した.フレーズ構造に基づく演奏表情付けはテンポ包絡の生成問題に帰着される.テンポ包絡は各階層のテンポ包絡を重ね合わせてモデル化を行った.モデルと実演奏データをフィッティングしてモデルの妥当性を検討した.主観評価実験の結果...
中村栄太, 齋藤康之, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(15) 1-6   2013年3月
鍵盤楽器における両手の演奏は,リズムが左右非同期である場合や独立性を持つ声部が合わさった楽譜の場合などに,互いに独立性を持つ.また,ピアノの運指は多くの場合,両手独立に考えられる.これらの場合,楽譜追跡や自動採譜,ピアノ運指決定等を目的とした演奏モデルは,並列した両手の演奏が依存しながら合わさったものとして記述するのが有効である.この際,MIDI 信号としての演奏は同一チャンネルを通して観測されるため,信号分離を含む逆推定が効率的に行えるモデルが必要である.本稿では,この様な鍵盤演奏を記述...
伊東直哉, 深山覚, 中村栄太, 齋藤大輔, 嵯峨山茂樹
研究報告音楽情報科学(MUS)   2013(23) 1-6   2013年3月
楽曲構造に基づくテンポ包絡の生成によって人間が演奏しているような演奏を生成する演奏表情付け法を提案するとともに,その楽曲構造の自動解析を楽譜からの類似箇所検出問題として定式化した.本報告では,音楽学で言及されている演奏表情の階層性に基づいてフレーズ構造に基づく演奏表情に着目した.フレーズ構造に基づく演奏表情付けはテンポ包絡の生成問題に帰着される.テンポ包絡は各階層のテンポ包絡を重ね合わせてモデル化を行った.モデルと実演奏データをフィッティングしてモデルの妥当性を検討した.主観評価実験の結果...
土屋政人, 落合和樹, 亀岡弘和, 嵯峨山茂樹
情報処理学会全国大会講演論文集   75th(2) 2.281-2.282   2013年3月
池澤 浩気, 北条 伸克, エスピ ミケル, 亀岡 弘和, 嵯峨山 茂樹
電子情報通信学会総合大会講演論文集   2013    2013年3月
吉里幸太, 北条伸克, 亀岡弘和, 齋藤大輔, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.1-7-7   2013年3月
北条伸克, 吉里幸太, 亀岡弘和, 齋藤大輔, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.1-7-6   2013年3月
池澤浩気, 北条伸克, ESPI Miquel, 亀岡弘和, 嵯峨山茂樹
電子情報通信学会大会講演論文集   2013 72   2013年3月
Sho Sato, Nobutaka Ono, Yutaka Kamamoto, Shigeki Sagayama
15th International Conference on Digital Audio Effects, DAFx 2012 Proceedings      2012年12月
This paper describes a novel algorithm for recovering time-domain signal from quantized amplitude and phase spectrogram, which is applicable for spectrogram-based audio coding. In order to obtain a better quality sound, a phase reconstruction tech...
Tatsuma Ishihara, Hirokazu Kameoka, Hirokazu Kameoka, Kota Yoshizato, Daisuke Saito, Shigeki Sagayama
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH   1017-1021   2013年1月
We have previously proposed a generative model of speech F 0 contours, based on the discrete-time version of the Fujisaki model (a model of the mechanisim for controlling F 0 s through laryngeal muscles). One advantage of this model is that it a...
Takayoshi Oshima, Yutaka Kamamoto, Takehiro Moriya, Nobutaka Ono, Shigeki Sagayama
2012 International Symposium on Communications and Information Technologies, ISCIT 2012   105-109   2012年12月
We designed variable length code for the vector quantization (VQ) gain parameter of the Algebraic Code-Excited Linear Prediction (ACELP) speech coding scheme, aiming at reduction of bit rate and distortion in the environment of IP communication. T...
堀 玄, 齋藤 大輔, 嵯峨山 茂樹
計量国語学   29(3) 104-106   2013年
石原達馬, 吉里幸太, 亀岡弘和, 齋藤大輔, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.1-7-9   2013年3月
堀 玄, 亀岡 弘和, 嵯峨山 茂樹
情報処理学会研究報告. [音楽情報科学]   2012-MUS-97(3) 1-6   2012年12月
入出力隠れマルコフモデルに基づき,与えられた楽曲を自動的にギターで演奏できるように編曲し,同時に運指決定を行うアルゴリズムを導入する.このアルゴリズムは元々ギターで演奏できる楽曲に対しては運指決定を行う.具体的には,左手のフォームと与えられた楽曲をそれぞれ隠れ状態と出力記号系列とする入出力隠れマルコフモデルの復号問題として自動編曲を定式化し,手動で設定した遷移確率および出力確率に基づき, Viterbi アルゴリズムを用いて自動編曲を行う.
堀玄, 亀岡弘和, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(5) ROMBUNNO.MUS-97,NO.3   2013年2月
鈴木 政隆, 小野 順貴, 谷口 徹, 酒井 優, 河村 聡典, ESPI Miquel, 嵯峨山 茂樹
電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント   112(293) 35-38   2012年11月
本研究では,様々な雑音が存在する実環境において,マイクロフォンアレイにより対象音声を強調する手法について論じる。具体的には,対象音声が発話されていない,非音声時間区間の情報を利用することで,補助関数型独立ベクトル分析の分離性能を向上させることを試みる。本手法は,非音声時間区間に含まれていない新たに到来した音を特定チャンネルに分離する効果も有する。実環境で収録した雑音を用いた実験結果について報告する。
鈴木 政隆, 小野 順貴, 谷口 徹, 酒井 優, 河村 聡典, ESPI Miquel, 嵯峨山 茂樹
電子情報通信学会技術研究報告. EA, 応用音響   112(292) 35-38   2012年11月
本研究では,様々な雑音が存在する実環境において,マイクロフォンアレイにより対象音声を強調する手法について論じる。具体的には,対象音声が発話されていない,非音声時間区間の情報を利用することで,補助関数型独立ベクトル分析の分離性能を向上させることを試みる。本手法は,非音声時間区間に含まれていない新たに到来した音を特定チャンネルに分離する効果も有する。実環境で収録した雑音を用いた実験結果について報告する。
齋藤大輔, 石原達馬, 橘秀幸, 亀岡弘和, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(3) ROMBUNNO.MUS-96,NO.6   2012年10月
土屋政人, 落合和樹, 亀岡弘和, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(3) ROMBUNNO.MUS-96,NO.10   2012年10月
中村栄太, 山本龍一, 齋藤康之, 酒向慎司, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(3) ROMBUNNO.MUS-96,NO.14   2012年10月
高宗典玄, 亀岡弘和, 土屋政人, 嵯峨山茂樹
情報処理学会研究報告(CD-ROM)   2012(3) ROMBUNNO.MUS-96,NO.12   2012年10月
北条伸克, 南賢太郎, 齋藤大輔, 亀岡弘和, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.2-2-7   2012年9月
中村栄太, 山本龍一, 酒向慎司, 齋藤康之, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.2-10-5   2012年9月
伊東直哉, 深山覚, 齋藤大輔, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.2-10-4   2012年9月
齋藤大輔, 石原達馬, 橘秀幸, 亀岡弘和, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.1-2-8   2012年9月
齋藤 大輔, 石原 達馬, 橘 秀幸, 亀岡 弘和, 嵯峨山 茂樹
情報処理学会研究報告. [音楽情報科学]   2012-MUS-96(6) 1-6   2012年8月
本稿では,特定話者の声に存在する歌声らしさを抽出し,任意の話者モデルに付加することで,歌声モデルを構築する手法を提案する.近年の話声の音声合成技術の発展に伴って,歌声合成技術は飛躍的に発展しているが,コーパスベースの手法における歌声合成モデルの個人性は,そのモデルを構築するためのデータベースに大きく依拠する.一方,話者適応技術を応用することで,少量の音声データを用いて対象歌手の歌声モデルを構成することも考えられるが,その音声データのうち不要な情報も含めて適応してしまう可能性がある.本研究で...
大嶋崇良, 鎌本優, 守谷健弘, 小野順貴, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.3-2-12   2012年9月
土屋 政人, 落合 和樹, 亀岡 弘和, 嵯峨山 茂樹
情報処理学会研究報告. [音楽情報科学]   2012-MUS-96(10) 1-6   2012年8月
本報告では音響信号からの自動採譜を目的とし,2 次元木構造によって楽譜が生成される高次プロセスと楽譜からスペクトログラムが生成される低次プロセスを一体化した生成モデルを構築し,モデルのパラメータを推論することで自動採譜を実現するアプローチを提案する.自動採譜は多重音中の各ノートの音高や発音時刻に加えてテンポや音価の推定といった様々な問題が相互依存する大変複雑な課題である.人間が音楽を理解する過程では,リズムやハーモニーといった音楽上の常識的な文法に当てはまるように多重音中の個々のノートを聴...
高宗典玄, 亀岡弘和, 土屋政人, 嵯峨山茂樹
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.2-10-8   2012年9月
高宗 典玄, 亀岡 弘和, 土屋 政人, 嵯峨山 茂樹
情報処理学会研究報告. [音楽情報科学]   2012-MUS-96(12) 1-4   2012年8月
本報告では,楽譜が与えられているもとで,音響信号を最もよく再現する MIDI のベロシティやオンセットの時刻といったパラメータを推定する問題を扱う.MIDI パラメータの推定を行うためには,MIDI が生成する音響信号のスペクトログラムと実際の観測音響信号のスペクトログラムの距離を最小化するようにパラメータを設定する必要がある.この最適化問題は膨大な解空間を持つため,単純に大域最適解を探すのは困難である.そこで,本研究では楽譜情報を用いて正解に近いパラメータを与えた上で補助関数法を用いて効...
中村 栄太, 山本 龍一, 齋藤 康之, 酒向 慎司, 嵯峨山 茂樹
情報処理学会研究報告. [音楽情報科学]   2012-MUS-96(14) 1-6   2012年8月
人間の演奏に対して自動的に伴奏を同期する,自動伴奏において楽譜追跡は重要な問題である.本稿では,装飾音や即興的な楽句を含む楽曲・演奏に対して追従可能な楽譜追跡について述べる.装飾音のモデル化を演奏生成を記述する隠れマルコフモデルを用いて行うとともに,さらに一般の即興的楽句の構造を記述する方法について議論する.このモデルを用いた楽譜追跡アルゴリズムを示し,その有効性を実際の演奏を用いて評価する.また,このアルゴリズムを用いた自動伴奏システムを構築し,その動作を確認する.
吉里 幸太, 亀岡 弘和, 齋藤 大輔, 嵯峨山 茂樹
情報処理学会研究報告. SLP, 音声言語情報処理   2012-SLP-92(9) 1-6   2012年7月
本稿では,統計的手法に基づく様々な音声アプリケーションに基本周波数(F0)パターンを組み入れるための強力な枠組みを確立するため,F0パターンの生成過程を表現したモデルである藤崎モデルの確率モデル化を行う.また,提案モデルを用いて観測F0パターンから藤崎モデルパラメータを推定するためのアルゴリズムを導出する.実音声を用いた定量評価実験を通して,提案手法が既存手法を上回る推定性能を持っていることを明らかにした.
嵯峨山茂樹, 小野順貴, 亀岡弘和, 齋藤大輔
研究報告音楽情報科学(MUS)   2012(5) 1-1   2012年5月
筆者は,永年音声情報処理の研究に携り,当該分野でこれまで培われてきた確率的・統計的アプローチを音楽信号処理や音楽情報処理の分野に適用し,さまざまな問題を扱ってきた1)。本講演では,音楽信号や情報を生成する確率モデルを立て,観測信号や情報からモデルパラメータを推定する 「確率的逆問題」 の手法の観点から,音楽信号処理、音楽情報処理の分野で著者らが行ってきた研究を中心にし,CrestMuse プロジェクトの成果も併せて解説・紹介する。各種の多重音解析 2)-6),調波音・打楽器音分離 7)-1...

書籍等出版物

 
Guide to Computing for Expressive Music Performance
Alexis Kirke, Eduardo R. Miranda, editors (担当:分担執筆, 範囲:Tae Hun Kim, S. Fukayama, T. Nishimoto, S. Sagayama: "Statistical Approach to Automatic Expressive Rendition of Polyphonic Piano Music")
Springer Verlag   2013年3月   

競争的資金等の研究課題

 
作曲・演奏・信号の数理モデルに基づく音楽の生成と解析の研究
学術振興会: 科学研究費補助金(基盤研究(A))
研究期間: 2017年4月 - 2019年3月    代表者: 嵯峨山茂樹
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2014年 - 2016年    代表者: 嵯峨山 茂樹
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2011年 - 2013年    代表者: 嵯峨山 茂樹
主な成果としては、(1) 自動採譜・分離・加工のために必須な技術である多重音解析に関しては、a) 音符のアタックをモデル化した混合ガウスモデル(GMM)による音符分解に基づき、合奏中の個別の音符推定と、音符ごとの楽器を認識する技術を開発し、b) 音楽生成プロセスのベイジアンモデリングによる音響信号の自動採譜アルゴリズムを開発した。(2) 楽音分離加工に関しては、a) 調波音と打楽器音の分離(HPSS)に関して数種類の目的関数を定義して性能を比較した。(3) 和声とリズムのモデルに関しては、...
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2008年 - 2010年    代表者: 嵯峨山 茂樹
数理モデルに基づいて音楽信号および音楽情報の解析・認識・加工・生成の多角的な研究を行い、多大な成果を生み出した。この中には、多重音の解析のために多重音モデルのパラメータ推定(HTC)に基づく方法、同じくスペクトログラムの非負値行列分解(NMF)に基づく方法、調波音と打楽器音の信号分離(HPSS)、スペクトログラムからの位相成分の復元に基づく楽曲の速度変換やピッチ変換などの高品質な信号加工、ステレオ音楽信号からのパート分離、人声に含まれる揺らぎ成分に基づく歌声の抽出と消去、音楽信号からの和声...
時系列メディアのデザイン転写技術の開発
(独)科学技術振興機構: 戦略的創造研究推進事業(CRESTタイプ) 研究領域「メディア芸術の創造の高度化を支える先進的科学技術の創出
研究期間: 2006年 - 2010年    代表者: 片寄晴弘
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2005年 - 2007年    代表者: 嵯峨山 茂樹
この研究は、主に多重音(和音など)や同時並行(伴奏など)を含む音楽信号と音楽情報を扱うために、多重音信号、多重音構造、時間並行構造を持つ対象の信号処理および情報処理の技術を、確率モデルに基づくアプローチにより新たに開拓し確立することを目的とした。典型的な応用分野としては、音楽の自動採譜、自動編曲、音楽情報検索、音楽の加工がある。調波・時間構造モデルに基づく多重音解析に関しては、調波構造と時間連接条件を満たす周波数時間平面上の混合ガウス分布で表現した音響オブジェクトモデルのパラメータ値を推定...
文部科学省: 科学研究費補助金(萌芽研究)
研究期間: 2005年 - 2006年    代表者: 嵯峨山 茂樹
カーナビの音声認識、ハンズフリー電話機、会議の録音などにおいて、マイクロホンアレーを用いて雑音を抑圧し目的音声を強調する研究が盛んに行われている。本研究の目的は、このような用途での信号処理において、複素スペクトル平面上での幾何的取り扱いという新しい着想に基づく手法(CSCC法)を確立し、またこの着想を拡大することである。本年度の主な成果は下記の通りである。1)位相拘束付CSCC法の検討従来のCSCC法は、観測信号が複素スペクトル平面上で円をなす、ということのみを条件として雑音抑圧を行ってい...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2002年 - 2004年    代表者: 嵯峨山 茂樹
MIDIデータを入力にして楽譜を復元するためのリズム認識を、意図された音価を持つ音符を隠れ状態に、変動を伴って実際に演奏された音符長を出力にして、HMMにおけるViterbi経路探索の問題として定式化した。多声部楽曲のリズム認識も、単一声部の問題に還元することで解決した。テンポのモデル化や、テンポ変化の検出なども音声認識におけるセグメンタルk-meansアルゴリズムを拡張した手法により可能となった。与えられた旋律に対する自動和声付けを、旋律の背後に存在するであろう和音を隠れ状態とし、旋律を...
擬人化音声対話エージェント基本ソフトウェアの開発
情報処理振興事業協会(IPA): 独創的情報技術育成事業開発テーマ
研究期間: 2000年7月 - 2003年3月    代表者: 嵯峨山茂樹
視覚障害者のための文字コミュニケーション技術開発
(財)石川県産業創出支援機構(ISICO): 地域産学官連携豊かさ創造研究開発プロジェクト
研究期間: 2000年7月 - 2002年3月    代表者: 嵯峨山茂樹
文部科学省: 科学研究費補助金(萌芽的研究)
研究期間: 2000年 - 2002年    代表者: 嵯峨山 茂樹
隠れマルコフモデル(HMM)を用いた現代の音声認識技術では、雑音環境・回線・話者などの使用条件が変わると、しばしば大きな性能低下を起こす。その理由は、環境雑音のような加法性要因、マイクロフォンやアンプの特性などのような乗法性要因、さらに話者の相違のように複雑な要素が絡み合っている要因などにより、音声スペクトルが変形するからである。この現象にHMMを適志させる手法において、微分幾何学的な発想で、定式化、アルゴリズム開発、検証を行った。今年度の主な成果を以下に示す。1.微分幾何に基づく音声認識...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 1999年 - 2001年    代表者: 嵯峨山 茂樹
連続音声認識の方法論をオンライン手書き文字認識の問題に応用して新手法を開発し、多くの成果を挙げた。原理は、連続音声認識における音素に代えて25種類の基本サブストローク、言語モデルに代えて漢字構造辞書を用いる。これに高度に進歩した連続音声認識の手法を応用して、漢字構造辞書を解空間とし、効率的な探索を行うことで、かなり崩れた手書き漢字でも認識できる技術を開発した。速度ベクトルを観測して隠れマルコフモデル(HMM)によってモデル化するため、筆先の運動から何の文字を書いたかの意図を認識する。このた...

特許

 
亀岡 弘和, 吉里 幸太, 齋藤 大輔, 嵯峨山 茂樹, 北条 伸克
亀岡 弘和, 吉里 幸太, 齋藤 大輔, 嵯峨山 茂樹, 北条 伸克
亀岡 弘和, 池澤 浩気, 北条 伸克, エスピ ミケル, 嵯峨山 茂樹
亀岡 弘和, 北条 伸克, 吉里 幸太, 齋藤 大輔, 嵯峨山 茂樹
亀岡 弘和, 石原 達馬, 吉里 幸太, 齋藤 大輔, 嵯峨山 茂樹
亀岡 弘和, 石原 達馬, 吉里 幸太, 齋藤 大輔, 嵯峨山 茂樹
亀岡 弘和, 北条 伸克, 吉里 幸太, 齋藤 大輔, 嵯峨山 茂樹
亀岡 弘和, 池澤 浩気, 北条 伸克, エスピ ミケル, 嵯峨山 茂樹
守谷 健弘, 鎌本 優, 原田 登, 亀岡 弘和, 嵯峨山 茂樹, 大嶋 崇良, 小野 順貴, 齋藤 大輔
守谷 健弘, 鎌本 優, 原田 登, 亀岡 弘和, 嵯峨山 茂樹, 大嶋 崇良, 小野 順貴, 齋藤 大輔
亀岡 弘和, 佐藤 美沙, 小野 拓磨, 小野 順貴, 嵯峨山 茂樹
亀岡 弘和, 小野 拓磨, 小野 順貴, 嵯峨山 茂樹
亀岡 弘和, 小野 拓磨, 小野 順貴, 嵯峨山 茂樹
亀岡 弘和, 佐藤 美沙, 小野 拓磨, 小野 順貴, 嵯峨山 茂樹
浜村 倫行, 入江 文平, 嵯峨山 茂樹, 小野 順貴, 西本 卓也
浜村 倫行, 入江 文平, 嵯峨山 茂樹, 小野 順貴, 西本 卓也
木村 昭悟, 亀岡 弘和, 柏野 邦夫, 中野 拓帆, 嵯峨山 茂樹, 宮部 滋樹, 小野 順貴, 西本 卓也
ルルー ジョナトン, 亀岡 弘和, 中野 允裕, 北野 佑, 小野 順貴, 嵯峨山 茂樹
木村 昭悟, 亀岡 弘和, 柏野 邦夫, 中野 拓帆, 嵯峨山 茂樹, 宮部 滋樹, 小野 順貴, 西本 卓也
嵯峨山 茂樹, 小野 順貴, 宮部 滋樹
ルルー ジョナトン, 亀岡 弘和, ヴァンサン エマヌエル, 水野 優, 小野 順貴, 嵯峨山 茂樹
ルルージョナトン, 亀岡 弘和, 柏野 邦夫, 小野 順貴, 嵯峨山 茂樹
小野 順貴, 嵯峨山 茂樹, 伊藤 信貴
亀岡 弘和, 柏野 邦夫, 松本 恭輔, 小野 順貴, 嵯峨山 茂樹
嵯峨山 茂樹, 小野 順貴, 亀岡 弘和, 宮本 賢一, ルルー ジョナトン
嵯峨山 茂樹, 山本 遼, 西本 卓也, 平木 敬, 稲葉 真理, 鈴木 隆文
嵯峨山 茂樹, 亀岡 弘和, 田原 鉄也, 西本 卓也
嵯峨山 茂樹, 小野 順貴, 山本 遼, 大坂 知之
嵯峨山 茂樹, 小野 順貴, 和泉 洋介
嵯峨山 茂樹, 武田 晴登, 西本 卓也, 平木 敬, 稲葉 真理, 鈴木 隆文
嵯峨山 茂樹, 米田 隆一, 西本 卓也
嵯峨山 茂樹, 槐 武也, 酒向 慎司, 松本 恭輔, 西本 卓也
嵯峨山 茂樹, 山本 遼, 山本 隼, 西本 卓也
嵯峨山 茂樹, 齊藤 翔一郎, 武田 晴登, 西本 卓也
嵯峨山 茂樹, 西本 卓也, 亀岡 弘和
嵯峨山 茂樹, チャンドラ カント ラウト, 西本 卓也, 山本 仁
嵯峨山 茂樹, 西本 卓也, 高橋 佳吾, 亀岡 弘和, 齊藤 翔一郎
嵯峨山 茂樹, 西本 卓也, 岡嶋 崇, 鎌本 優
嵯峨山 茂樹, 鎌本 優, 西本 卓也, 堀内 俊治, 水町 光徳, 中村 哲
山口 義和, 嵯峨山 茂樹, 高橋 淳一, 高橋 敏
山口 義和, 嵯峨山 茂樹, 高橋 淳一, 高橋 敏
實廣 貴敏, 松永 昭一, 嵯峨山 茂樹
山田 智一, 嵯峨山 茂樹, 松永 昭一
野田 喜昭, 松永 昭一, 嵯峨山 茂樹
▲吉▼岡 理, 相川 清明, 嵯峨山 茂樹
水野 理, 相川 清明, 嵯峨山 茂樹
高橋 敏, 山口 義和, 嵯峨山 茂樹
高橋 敏, 嵯峨山 茂樹
山田 智一, 嵯峨山 茂樹
山田 智一, 嵯峨山 茂樹
實廣 貴敏, 嵯峨山 茂樹
水野 理, 高橋 敏, 嵯峨山 茂樹
野田 喜昭, 嵯峨山 茂樹
實廣 貴敏, 嵯峨山 茂樹
高橋 淳一, 嵯峨山 茂樹
山田 智一, 嵯峨山 茂樹