奥乃 博

J-GLOBALへ         更新日: 19/01/17 13:42
 
アバター
研究者氏名
奥乃 博
 
オクノ ヒロシ
通称等の別名
gitchang
eメール
okunonue.org
URL
http://www.aoni.waseda.jp/okuno/
所属
早稲田大学
部署
理工学術院
職名
教授(任期付)
学位
博士(工学)(東京大学)
その他の所属
ヒューマノイド・ロボット共創研究所理工学術院総合研究所(理工学研究所)
科研費研究者番号
60318201
ORCID ID
0000-0002-8704-4318

プロフィール

・早稲田大学 実体情報学博士プログラム (http://www.leading-sn.waseda.ac.jp/) に所属
・ Google Scholar h-index: 48
・ Scopus h-index: 29
・ Web of Science h-index: 17

研究分野

 
 

経歴

 
2014年4月
 - 
現在
早稲田大学 理工学術院 創造理工学研究科 総合機械工学専攻 教授(任期付)
 
2001年4月
 - 
2014年3月
京都大学大学院 情報学研究科 知能情報学専攻 教授
 
1999年4月
 - 
2001年3月
東京理科大学  理工学部情報科学科 教授
 
1998年9月
 - 
2004年3月
科学技術振興事業団  ERATO北野共生システムプロジェクト グループリーダ
 
1998年9月
 - 
1999年3月
科学技術振興事業団  ERATO北野共生システムプロジェクト 技術参事
 
1972年4月
 - 
1998年9月
日本電信電話株式会社 武蔵野電気通信研究所,基礎研究所,ソフトウエア研究所 グループリーダ,主幹研究員
 

学歴

 
 
 - 
1996年3月
東京大学 大学院工学系研究科 情報工学専攻 博士(工学)論文
 
1968年4月
 - 
1972年3月
東京大学 教養学部 基礎科学科
 

委員歴

 
2012年4月
 - 
現在
最高裁判所  東京高等裁判所, 東京地方裁判所及び大阪地方裁判所所属 専門委員
 
2012年4月
 - 
2018年3月
(独)大学評価・学位授与機構  学位審査会審査委員
 
2003年4月
 - 
2018年3月
(独)大学評価・学位授与機構  学位審査会専門委員
 
2011年6月
 - 
2013年5月
(一社)情報処理学会  理事(学会誌担当)
 
2003年6月
 - 
2005年5月
(社)人工知能学会  理事(広報担当)
 
2003年
 - 
2005年
(社)日本ロボット学会  「ロボット聴覚」研究専門調査委員会委員長
 
1997年
 - 
2003年
Association for Computing Machinery  SIGART Intelligence編集委員
 
1994年
 - 
1998年6月
日本ソフトウェア科学会  理事(広報・企画担当)
 
1993年4月
 - 
2006年3月
情報処理学会  英文図書出版委員・英文論文誌編集委員会
 

受賞

 
2019年1月
Amity University 名誉教授
 
2019年1月
Amity University Amity Researcher Award For Significant Contribution in the Field of Robot Audition
 
2016年10月
日本ロボット学会 2016 Advanced Robotics Best Paper Award Posture Estimation of Hose-shaped Robot by using Active Microphoe Array
受賞者: 奥乃 博 他
 
2015年10月
IEEE-RAS Best Innovative Paper Award Human-Voice Enhancement based on Online RPCA for a Hose-shaped Rescue Robot with a Microphone Array
受賞者: 奥乃 博 他
 
2015年9月
日本ロボット学会 フェロー
 
2015年6月
情報処理学会 フェロー
 
2014年10月
日本学術振興会 科学技術研究費補助金 平成26年度審査委員表彰
 
2014年9月
日本ロボット学会 2nd Advanced Robotics Best Paper Award A real-time super-resolution robot audition system that improves the robustness of simultaneous speech recognition
受賞者: 奥乃 博 他
 
2014年6月
人工知能学会 2013年度業績賞
 
2014年5月
人工知能学会 2013年度研究会優秀賞 振動子モデルと音声可視化システムを用いたアマガエルの合唱法則の解析
 
2014年4月
京都大学 名誉教授
 
2013年11月
The 8th International Workshop on Security (IWSEC 2013) The Best Paper Award Solving Google's Continuous Audio CAPTCHA with HMM-based Automatic Speech Recognition
受賞者: 奥乃 博 他
 
2013年6月
人工知能学会 フェロー
 
2013年6月
International Society for Applied Intelligence Award for the Best Paper Improved Sound Source Localization and Front-Back Disambiguation for Humanoid Robots with Two Ears
 
2013年4月
文部科学省 平成25年度 文部科学大臣表彰科学技術賞(研究部門) 聞き分ける技術に基づいたロボット聴覚の研究
 
2012年1月
IEEE フェロー
 
2011年6月
人工知能学会 2010年度研究会優秀賞 発語行為レベルの情報を用いた音声対話システムの構築とデータ分析
 
2010年10月
RSJ and IEEE NTF Award for Entertainment Robots and System Robot Musical Accompaniment: Integrating Audio and Visual Cues for Real-time Synchronization with a Human Flutist
受賞者: 奥乃 博 他
 
2010年6月
International Society for Applied Intelligence Award for a Best Paper Music-ensemble robot that is capable of playing the theremin while listening to the accompanied music
 
2007年
RSJ and IEEE RSJ/SICE AWARD for IROS2006 Best Paper Nomination Fiinalist Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears
 
2006年
FIT2004論文賞
 
Dep.2006
2005年
ISMIR-2005 Audio Drum Detection Contest, Best in Class Award
 
Sep. 2005
2005年
International Society for Applied Intelligence, IEA/AID-2005 Best Paper Award
 
Jun. 2005
2003年
(社)人工知能学会 2002年度研究会優秀賞
 
2003年
(社)人工知能学会 第16回全国大会優秀論文賞
 
2003年
(財)船井情報科学財団第2回情報科学振興賞
 
2002年
(社)計測自動制御学会 第3回システムインテグレーション部門 講演会 (SI2002) ベストセッション賞
 
2002年
Nakamura Award for IROS 2001 Best Paper Finalist Nomination, IEEE and RSJ
 
2001年
第17回電気通信普及財団賞 テレコムシステム技術賞奨励賞
 
2001年
IEA/AIE-2001 Best Paper Award, International Society of Applied Intelligence
 
2001年
人工知能学会研究奨励賞
 
2000年
IS-2000 Best Paper Award(最優秀論文賞)
 
1997年
人工知能学会第11回全国大会優秀論文賞
 
1991年
人工知能学会1990年度論文賞
 

論文

 
Kotaro Hoshiba, Kazuhiro Nakadai, Kazuhiro Nakadai, Makoto Kumon, Hiroshi G. Okuno, Hiroshi G. Okuno
Journal of Robotics and Mechatronics   30(3) 426-435   2018年6月   [査読有り]
© 2018, Fuji Technology Press. All rights reserved. We have studied sound source localization, using a microphone array embedded on a UAV (unmanned aerial vehicle), for the purpose of detecting for people to rescue from disaster-stricken areas or ...
Yoahiki Bando,Katsutoshi Itoyama,,Satoshi Tadokoro,,Kazuyoshi Yoshii,Tatsuya Kawahara,Hiroshi G. Okuno
IEEE/ACM Trans. Audio, Speech & Language Processing   26(2) 215-230   2018年2月   [査読有り]
Suzuki Reiji, Matsubayashi Shiho, Saito Fumiyuki, Murate Tatsuyoshi, Masuda Tomohisa, Yamamoto Koichi, Kojima Ryosuke, Nakadai Kazuhiro, Okuno Hiroshi G.
ECOLOGY AND EVOLUTION   8(1) 812-825   2018年1月   [査読有り]
Ikkyu Aihara, Phillip J. Bishop, Michel E.B. Ohmer, Hiromitsu Awano, Takeshi Mizumoto, Hiroshi G. Okuno, Peter M. Narins, Jean Marc Hero
Scientific Reports   7    2017年12月   [査読有り]
© 2017 The Author(s). Many animals use sounds produced by conspecifics for mate identification. Female insects and anuran amphibians, for instance, use acoustic cues to localize, orient toward and approach conspecific males prior to mating. Here w...
Kotaro Hoshiba,Kai Washizaki,Mizuho Wakabayashi,Takahiro Ishiki,Array,Yoshiaki Bando,Daniel Gabriel,Kazuhiro Nakadai,Hiroshi G. Okuno
Sensors   17(11) 2535   2017年11月   [査読有り]
Hiroshi G. Okuno, Kazuhiro Nakadai
Journal of Robotics and Mechatronics   29(1) 15   2017年2月   [査読有り]
Takeshi Mizumoto,Ikkyu Aihara,Takuma Otsuka,Hiromitsu Awano,Hiroshi G. Okuno
JRM   29(1) 255-267   2017年2月   [査読有り]
Ikkyu Aihara,Ryu Takeda,Takeshi Mizumoto,Takuma Otsuka,Hiroshi G. Okuno
JRM   29(1) 247-254   2017年2月   [査読有り]
Shiho Matsubayashi,Reiji Suzuki,Fumiyuki Saito,Tatsuyoshi Murate,Tomohisa Masuda,Koichi Yamamoto,Ryosuke Kojima,Kazuhiro Nakadai,Hiroshi G. Okuno
JRM   29(1) 224-235   2017年2月   [査読有り]
Reiji Suzuki,Shiho Matsubayashi,Richard W. Hedley,Kazuhiro Nakadai,Hiroshi G. Okuno
JRM   29(1) 213-223   2017年2月   [査読有り]
Yoshiaki Bando,Hiroshi Saruwatari,Nobutaka Ono,Shoji Makino,Katsutoshi Itoyama,Daichi Kitamura,Masaru Ishimura,Moe Takakusaki,Narumi Mae,Kouei Yamaoka,Yutaro Matsui,Yuichi Ambe,Masashi Konyo,Satoshi Tadokoro,Kazuyoshi Yoshii,Hiroshi G. Okuno
JRM   29(1) 198-212   2017年2月   [査読有り]
Ryo Suzuki,Takuto Takahashi,Hiroshi G. Okuno
JRM   29(1) 146-153   2017年2月   [査読有り]
Takuya Suzuki,Hiroaki Otsuka,Wataru Akahori,Yoshiaki Bando,Hiroshi G. Okuno
JRM   29(1) 72-82   2017年2月   [査読有り]
Kazuhiro Nakadai,Array,Takeshi Mizumoto
JRM   29(1) 16-25   2017年2月   [査読有り]
Vol.27, No.1 (Feb. 2017), pp.16-25
Hiroshi G. Okuno,Kazuhiro Nakadai
JRM   29(1) 15   2017年   [査読有り]
Kazuhiro Nakadai,Makoto Kumon,Hiroshi G. Okuno,Kotaro Hoshiba,Mizuho Wakabayashi,Kai Washizaki,Takahiro Ishiki,Daniel Gabriel,Yoshiaki Bando,Takayuki Morito,Ryosuke Kojima,Osamu Sugiyama
2017 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2017, Vancouver, BC, Canada, September 24-28, 2017   5985-5990   2017年   [査読有り]
LaBarge Samuel A., Migdal Christopher W., Buckner Elisa H., Okuno Hiroshi, Gertsman Ilya, Stocks Ben, Barshop Bruce A., Nalbandian Sarah R., Philp Andrew, McCurdy Carrie E., Schenk Simon
FASEB JOURNAL   30(4) 1623-1633   2016年4月   [査読有り]
中臺 一博, 奥乃 博, 水本 武志, 中村 圭佑
シミュレーション = Journal of the Japan Society for Simulation Technology   35(1) 32-38   2016年3月
Jean-Marc Valin,Shun'ichi Yamamoto,Jean Rouat,François Michaud,Kazuhiro Nakadai,Hiroshi G. Okuno
CoRR   abs/1602.06442    2016年   [査読有り]
Koichiro Yoshino,Naoki Hirayama,Shinsuke Mori,Fumihiko Takahashi,Katsutoshi Itoyama,Hiroshi G. Okuno
Proceedings of the Tenth International Conference on Language Resources and Evaluation LREC 2016, Portorož, Slovenia, May 23-28, 2016.      2016年   [査読有り]
Reiji Suzuki,Shiho Matsubayashi,Kazuhiro Nakadai,Hiroshi G. Okuno
Interspeech 2016, 17th Annual Conference of the International Speech Communication Association, San Francisco, CA, USA, September 8-12, 2016   2626-2630   2016年   [査読有り]
Yoshiaki Bando,Hiroki Suhara,Motoyasu Tanaka,Tetsushi Kamegawa,Katsutoshi Itoyama,Kazuyoshi Yoshii,Fumitoshi Matsuno,Hiroshi G. Okuno
2016 IEEE International Symposium on Safety, Security, and Rescue Robotics, SSRR 2016, Lausanne, Switzerland, October 23-27, 2016   207-213   2016年   [査読有り]
Ikkyu Aihara,Takeshi Mizumoto,Hiromitsu Awano,Hiroshi G. Okuno
Interspeech 2016, 17th Annual Conference of the International Speech Communication Association, San Francisco, CA, USA, September 8-12, 2016   2597-2601   2016年   [査読有り]
Bando Y, Itoyama K, Konyo M, Tadokoro S, Nakadai K, Yoshii K, Okuno H.G.
SSRR 2015 - 2015 IEEE International Symposium on Safety, Security, and Rescue Robotics      2016年   [査読有り]
Yoshiaki Bando,Katsutoshi Itoyama,Array,Satoshi Tadokoro,Kazuhiro Nakadai,Kazuyoshi Yoshii,Hiroshi G. Okuno
24th European Signal Processing Conference, EUSIPCO 2016, Budapest, Hungary, August 29 - September 2, 2016   1018-1022   2016年   [査読有り]
Jo{ã}o Lobato Oliveira, G{ö}khan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Fabien Gouyon, Lu{\'{\i}}s Paulo Reis
I. J. Humanoid Robotics   12(4)    2015年12月   [査読有り]
Akira Maezawa,Katsutoshi Itoyama,Kazuyoshi Yoshii,Array
2015 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, WASPAA 2015, New Paltz, NY, USA, October 18-21, 2015   1-5   2015年10月   [査読有り]
Yoshiaki Bando,Katsutoshi Itoyama,Array,Satoshi Tadokoro,Kazuhiro Nakadai,Kazuyoshi Yoshii,Array
2015 IEEE International Symposium on Safety, Security, and Rescue Robotics, SSRR 2015, West Lafayette, IN, USA, October 18-20, 2015   1-6   2015年10月   [査読有り]
Izaya Nishimuta, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno
Advanced Robotics   29(18) 1205-1219   2015年9月   [査読有り]
Yoshiaki Bando,Katsutoshi Itoyama,Array,Satoshi Tadokoro,Kazuhiro Nakadai,Kazuyoshi Yoshii,Array
2015 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2015, Hamburg, Germany, September 28 - October 2, 2015   5580-5586   2015年9月   [査読有り]
Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata
Appl. Intell.   42(4) 722-737   2015年6月   [査読有り]
Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata
Advanced Robotics   29(9) 587-596   2015年5月   [査読有り]
Array,Kazuhiro Nakadai
2015 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2015, South Brisbane, Queensland, Australia, April 19-24, 2015   5610-5614   2015年4月   [査読有り]
Yoshiaki Bando,Takuma Otsuka,Katsutoshi Itoyama,Kazuyoshi Yoshii,Yoko Sasaki,Satoshi Kagami,Array
2015 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2015, South Brisbane, Queensland, Australia, April 19-24, 2015   723-727   2015年4月   [査読有り]
Akira Maezawa,Array
Computer Music Journal   39(1) 74-87   2015年3月   [査読有り]
Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shinsuke Mori, Hiroshi G. Okuno
IEEE/ACM Trans. Audio Speech Lang. Process.   23(2) 373   2015年2月   [査読有り]
Angelica Lim, Hiroshi G. Okuno
I. J. Social Robotics   7(1) 35-49   2015年2月   [査読有り]
Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shinsuke Mori, Hiroshi G. Okuno
IEEE/ACM Trans. Audio, Speech & Language Processing   23(2) 373-382   2015年2月   [査読有り]
Yoshiaki Bando, Takuma Otsuka, Takeshi Mizumoto, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Hiroshi G. Okuno
Advanced Robotics   29(1) 35-49   2015年1月   [査読有り]
Ui-Hyun Kim,Kazuhiro Nakadai,Array
Appl. Intell.   42(1) 63-74   2015年1月   [査読有り]
Naoki Hirayama,Koichiro Yoshino,Katsutoshi Itoyama,Shinsuke Mori,Array
IEEE/ACM Trans. Audio, Speech & Language Processing   23(2) 373-382   2015年   [査読有り]
Kuniaki Noda,Yuki Yamaguchi,Kazuhiro Nakadai,Array,Array
Appl. Intell.   42(4) 722-737   2015年   [査読有り]
Shotaro Sano,Takuma Otsuka,Katsutoshi Itoyama,Array
JIP   23(6) 814-826   2015年   [査読有り]
Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno
2015 IEEE International Symposium on Safety, Security, and Rescue Robotics, SSRR 2015, West Lafayette, IN, USA, October 18-20, 2015   1   2015年   [査読有り]
João Lobato Oliveira,Gökhan Ince,Keisuke Nakamura,Kazuhiro Nakadai,Array,Fabien Gouyon,Array
I. J. Humanoid Robotics   12(4)    2015年   [査読有り]
Nishimuta I, Hirayama N, Yoshii K, Itoyama K, Okuno H.G.
IEEE-RAS International Conference on Humanoid Robots   2015-February 967-972   2015年   [査読有り]
Yoshiaki Bando,Takuma Otsuka,Ikkyu Aihara,Hiromitsu Awano,Katsutoshi Itoyama,Kazuyoshi Yoshii,Hiroshi Gitchang Okuno
Computational Sustainability, Papers from the 2015 AAAI Workshop, Austin, Texas, USA, January 26, 2015.   WS-15-06 2-6   2015年   [査読有り]
Bando Y, Otsuka T, Itoyama K, Yoshii K, Sasaki Y, Kagami S, Okuno H.G.
ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings   2015-August 723-727   2015年   [査読有り]
Maezawa A, Okuno H.G.
Computer Music Journal   39(1) 74-87   2015年   [査読有り]

Misc

 
坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 河原 達也, 奥乃 博
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116(189) 47-52   2016年8月
前澤 陽, 糸山 克寿, 吉井 和佳, 奥乃 博
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114(52) 105-110   2014年5月
本稿では,同一楽曲を演奏した複数の音響信号に対して時間軸対応付け(音響信号間アライメント)を行うための確率モデルを提案する.我々は,アライメント結果に基づいて演奏分析を行う応用を考えると,複数の演奏の背後に存在する潜在的な共通構造と各演奏に固有の時間的ゆらぎとを区別することが重要であると考えている.従来は,動的時間伸縮法(DTW)やLeft-to-Right型隠れマルコフモデル(LRHMM)を用いて,表層的な音響的類似度に基づいて対応点を探す手法が主流であった.一方,本研究では,複数の演奏...
池宮 由楽, 糸山 克寿, 奥乃 博
電子情報通信学会技術研究報告. SP, 音声   114(52) 243-244   2014年5月
本稿では,市販楽曲からビブラート,こぶしやグリッサンドといった歌い方に関係する特徴を歌唱表現として抽出することで,歌手の歌い方のライブラリを作成する手法について述べる.これらの特徴は,歌唱F0軌跡中の特徴的な変動として現れる.本手法ではまず,時間周波数領域での最適経路探索問題を定式化することにより高周波数分解能,高精度な歌唱F0推定を行う.推定F0軌跡からパターンマッチングにより各歌唱表現を同定,パラメータ表現する.実験では,実際に市販楽曲からプロ歌手の歌唱表現を抽出できることを確認した.
池宮由楽, 糸山克寿, 奥乃博
研究報告音楽情報科学(MUS)   2013(20) 1-6   2013年8月
本稿では,伴奏付き歌唱に含まれるビブラートやこぶしといった歌い方要素を個別に抽出する手法について述べる.歌い方要素は歌唱者の個人性を強く反映し,それらを個別に検出しパラメータ化することで,CGM や MIR への多様な応用が可能となる.本手法では,ユーザが簡易に取得できる歌唱の音高列を事前知識として用いる.音高列から探索範囲を制限したビタビ探索によって高精度に F0 を推定する.各要素は歌唱者の意図による F0 の特徴的な変動として現れ,それらを個別に検出し,設計したモデルに従ってパラメー...
矢澤一樹, 糸山克寿, 奥乃博
研究報告音楽情報科学(MUS)   2013(17) 1-6   2013年8月
本稿では,ギター演奏者の演奏支援をするために実際のギター演奏音から演奏者の習熟度に応じたタブ譜を自動生成する手法について述べる.具体的には,初級者向けには音符の欠落などを許容してでも演奏が容易なタブ譜を,上級者向けには音高を正確に再現するタブ譜を,それぞれ生成する.推定される運指の難易度は,音響再現度と運指容易度の相対的な重みをユーザー側で調整することによって変更可能である.本手法によって得られたタブ譜について音響再現度と運指容易度の両面から評価を行った結果,パラメータを変更することによっ...
前澤陽, 奥乃博
研究報告音楽情報科学(MUS)   2013(14) 1-6   2013年8月
本稿では,同一の楽曲を演奏する複数の音楽音響信号のうち,それぞれが楽譜の一部のパートのみを演奏した場合における,オーディオアライメント手法-楽曲パート混合オーディオアライメント-について報告する.本手法では,音楽音響信号を 3 つの階層- (1) 対象となる音響信号群を構成するスペクトルテンプレートの集合,(2) スペクトルテンプレート組合せの時系列,(3) 各音響信号で出現する (2) の構成要素-で表現する.具体的には,時系列は Left-oright 隠れマルコフモデル (LRHMM...
糸山克寿, 奥乃博
研究報告音楽情報科学(MUS)   2013(5) 1-6   2013年8月
本稿では,音源分離などに起因する雑音や歪みを含む楽器音に対して,それらを含まないクリーンな楽器音を得るための仮想楽器音源のパラメータ推定法について述べる.多数の楽器音をランダムに生成し,楽器音からフレームベースの音響特徴量とその統計量を計算する.重回帰分析を用いて音源パラメータと音響特徴量との関係を学習し,未知楽器音のパラメータをその関係性を用いて推定する.評価実験の結果,推定対象のパラメータが少ない場合には学習データを十分に用意することで,実用上十分な精度でのパラメータ推定を実現した.
平山 直樹, 森 信介, 奥乃 博
電子情報通信学会技術研究報告 : 信学技報   112(369) 7-12   2012年12月
本稿では,日本語方言音声認識のための言語モデルの統計的構築法を開発する.方言言語モデル構築においては,その方言の言語コーパスの不足が大きな課題である.その解決のため,大規模共通語言語コーパスの単語単位での方言への変換を行う.共通語・方言間の対訳コーパスを用いて統計的に変換ルールを学習し,重み付き有限状態トランスデューサ(WFST)で変換器を実装する.このWFSTに共通語文章を入力することで,対応する方言文章が自動的に出力される.本手法で構築した方言言語モデルを用いて方言音声認識を行うことで...
阪上大地, 大塚琢馬, 糸山克寿, 奥乃博
研究報告音楽情報科学(MUS)   2012(9) 1-6   2012年8月
本稿では,音の三要素 (音量・音高・音色) を同時にモデル化し,音楽の多重音解析を行う手法,ベイジアン非負値調波領域分解について報告する.本手法では,非負値行列因子分解 (NMF) にならい,観測音のウェーブレットスペクトログラムを基底とアクティベーションの積に分解する.さらに,各基底を調波構造を模した混合ガウス分布とすることで,各単音の音高・音色を表現する.これは,NMF と調波クラスタリングを統合した非負値調波因子分解 (NHF) という手法により実現する.パラメータの推定時には,特性...
糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博
全国大会講演論文集   2012(1) 355-357   2012年3月
人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, ...
西川直毅, 糸山克寿, 藤原弘将, 後藤真孝, 尾形哲也, 奥乃博
全国大会講演論文集   2012(1) 337-339   2012年3月
本稿では,楽曲印象軌跡を用いた楽曲検索システムの実装と,被験者実験による評価について報告する.実際の楽曲において,印象は時々刻々と変化し,また印象は歌詞と音響信号の両方で特徴づけられる.この2点の特徴を反映する為に,我々は楽曲印象を歌詞印象軌跡と音響印象軌跡の組み合わせで表現する.歌詞印象軌跡は確率的潜在意味解析,音響信号印象軌跡は多重線形回帰を用いて推定する.ユーザは検索システムに歌詞,音響信号印象軌跡を入力し,入力軌跡と類似する軌跡を持つ楽曲が検索される.印象軌跡間の類似度はDPマッチ...
阿曽慎平, 齋藤毅, 後藤真孝, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博
全国大会講演論文集   2012(1) 625-627   2012年3月
アクセント特徴量を用いて歌声と歌詞の朗読音声を識別するシステムを開発した.システムの入力は雑音を含まない単独音声,出力は歌声か朗読音声かの2値である.我々はリズム構造が歌声と朗読音声で聴感上異なることに着目し,リズムと関連が強いと考えられるアクセント特徴量を識別に用いた.この特徴量は音響的な時間変化の大きい部分,例えば音素境界や発話開始時間で極大値(ピーク)を持つ.隣り合うアクセントピークの時間間隔と,アクセント強度の分布をそれぞれ混合ガウス分布でモデル化し,2つの識別機を設計した.実験の...
黄楊暘, 大塚琢馬, 高橋徹, 尾形哲也, 奥乃博
全国大会講演論文集   2012(1) 581-583   2012年3月
ロボットが自身に備え付けられたマイクロフォンを用いて、動的音環境を認識するのは、声をかけられる時の対応などのロボットの実環境運用にとって重要である。この中で音源追跡は、音源位置の推定や音源分離精度の向上に有用である。動的環境下での音源追跡には1)音源数増減の対処,2)交差移動する音源軌跡の曖昧性の解消,3)断続的に観測される音源の同定の課題がある。我々はこれらの課題に対して1)パーティクル更新の際に音源の生成を考慮する提案分布の設計,2)粒子の状態変数に加速度を導入した運動モデルの構築,3...
平澤恭治, 安良岡直希, 高橋徹, 尾形哲也, 奥乃博
全国大会講演論文集   2012(1) 577-579   2012年3月
人間の生活環境に存在する多数の音源を正しく分離するために, 我々はマイク数以上の音源分離(劣決定音源分離)の検討を行っている. 我々は同時発話分離のために混合ガウス分布を用いた調波・非調波音源モデルを提案しているが, 調波部分は理論的に正当化されたモデル化が行われている一方で, 非調波部分のモデルには理論的な正当性がなく, 分離性能を低下させる要因となっていた. 本稿では従来の調波・非調波音源モデルに対して変更を加え, SiSEC2011で用いられた男女3-4話者の混合音声を分離する実験に...
安良岡 直希, 奥乃 博
研究報告音楽情報科学(MUS)   2012(27) 1-8   2012年1月
本稿では,多重奏音楽音響信号の振幅スペクトログラムを,J種類の音色構造と K 種類の調波構造の組み合わせ,及び L 種類の異なる音色を持つ非調波構造,の 3 要素に分解する新しい音響信号分析法について述べる.調波構造を調波ガウス関数列で,音色構造を全極型伝達関数でそれぞれモデル化し,その和で構成されるスペクトログラムモデルのパラメータ (音高,音量,音色に対応) を補助関数法を用いて一挙に推定する.また,推定結果を用いて楽器パートごとの音量操作を行う試作 GUI をいくつかの動作例とともに...
阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博
研究報告音楽情報科学(MUS)   2012(13) 1-8   2012年1月
本稿では,歌声と朗読音声を識別するシステムについて述べる.入力は無雑音音声,出力は歌声と朗読音声それぞれの尤度 (連続値) である.従来,スペクトル包絡 (MFCC) と基本周波数 (F0) の時間変化に基づいた識別システムが報告されている.これらの特徴量に基づく識別器に,スペクトル変化量のピーク間隔という,音素継続時間に関連する特徴量に基づく識別器を加え,入力音声長に応じて各識別器への重みを変化させた.実験の結果,従来システムでは1秒の音声に対し 86.7% の精度であったのに対し,本シ...
安良岡 直希, 奥乃 博
研究報告音声言語情報処理(SLP)   2012(27) 1-8   2012年1月
本稿では,多重奏音楽音響信号の振幅スペクトログラムを,J種類の音色構造と K 種類の調波構造の組み合わせ,及び L 種類の異なる音色を持つ非調波構造,の 3 要素に分解する新しい音響信号分析法について述べる.調波構造を調波ガウス関数列で,音色構造を全極型伝達関数でそれぞれモデル化し,その和で構成されるスペクトログラムモデルのパラメータ (音高,音量,音色に対応) を補助関数法を用いて一挙に推定する.また,推定結果を用いて楽器パートごとの音量操作を行う試作 GUI をいくつかの動作例とともに...
阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博
研究報告音声言語情報処理(SLP)   2012(13) 1-8   2012年1月
本稿では,歌声と朗読音声を識別するシステムについて述べる.入力は無雑音音声,出力は歌声と朗読音声それぞれの尤度 (連続値) である.従来,スペクトル包絡 (MFCC) と基本周波数 (F0) の時間変化に基づいた識別システムが報告されている.これらの特徴量に基づく識別器に,スペクトル変化量のピーク間隔という,音素継続時間に関連する特徴量に基づく識別器を加え,入力音声長に応じて各識別器への重みを変化させた.実験の結果,従来システムでは1秒の音声に対し 86.7% の精度であったのに対し,本シ...
森 信介, 駒谷 和範, 勝丸 真樹, 尾形 哲也, 奥乃 博
情報処理学会論文誌   52(12) 3398-3407   2011年12月
音声対話システムにおいて,ユーザはしばしば名称の一部を省略して「簡略表現」として発話する.その結果,音声認識誤りを招く.我々は,簡略表現を元の表現の単語列の一部の単語を省略した表現として定義し,簡略表現を確率とともに自動生成して音声認識辞書に自動追加する.簡略表現の取得には,日本語では複合語を分割する必要があるが,形態素解析器のみの分割では固有名詞は必ずしも正確に分割できない.さらに,多くの簡略表現を辞書に追加すると,語彙サイズの増加により音声認識精度が劣化する.我々は,これらの問題の解決...
前澤 陽, 糸山 克寿, 尾形 哲也, 奥乃 博
研究報告音楽情報科学(MUS)   2011(19) 1-6   2011年7月
本稿では、楽器パート毎に、楽譜と音響信号のアライメントを算出する手法を提案する。本手法では、各楽器パートに共通の、自己回帰過程に従うテンポモデルを持たせる。各楽器パートの時系列は隠れセミマルコフモデルに従い、状態継続長の事前分布としてテンポモデルを持つ。また、音響信号の出力は潜在的調波配分法に従う。パート間の揺らぎを持たせない場合の、アライメントの性能を評価し、アライメント手法としての有用性が確認された。また、演奏における発音タイミングの揺らぎがモデル化できることが示唆された。This p...

書籍等出版物

 
奥乃 博, 京都大学大学院情報学研究科
[奥乃博]   2007年   
International Conference on Industrial & Engineering Applications of Artificial Intelligence & Expert Systems, 奥乃 博, Ali Moonis
Springer   2007年   ISBN:9783540733225
Distance Based Dynamic Interaction of Humanoid Robot with Multiple People
LNAI, Springer   2005年   
Jun. 2005
奥乃 博, 京都大学大学院情報学研究科
[奥乃博]   2004年   
Design and Implementation of Personality of Humanoids in Human Humanoid Non-verbal Interaction
Springer-Verlag   2003年   
Pitch-Dependent Musical Instrument Identification and Its Application to Musical Sound Ontology
Springer-Verlag   2003年   
Social Interaction of Humanoid Robot through Auditory and Visual Tracking
Springer-Verlag   2002年   
Realizing Audio-Visually triggered ELIZA-like non-verbal Behaviors
Springer-Verlag   2002年   
Real-time Sound Source Localization and Separation based on Active Audio-Visual Integration
Springer-Verlag   2002年   
Sound and Visual Tracking by Active Audition
Enabling Society with Information Technology, Springer-Verlag   2002年   
Advanced Lisp Technology
Taylor and Francis Publishers, London, UK   2002年   
湯淺 太一, 奥乃 博
Taylor & Francis   2002年   ISBN:0415298199
And The Fans are Going Wild! SIG plus MIKE
Springer-Verlag   2001年   
Bridging gap between small sized league and simulator league
Springer-Verlag   2001年   
Sound and Visual Tracking for Humanoid Robot
Springer-Verlag   2001年   
Detection of Oriented Repetitive Alternating Patterns in Color Images --- A Computational Model of Monkey Grating Cells
Springer-Verlag   2001年   
PCクラスタ構築法-Linuxクラスタベオウルフ
産業図書出版   2001年   
Sterling Thomas L., Salmon John, Becker Donald J., Savarese Daniel F., 北野 宏明, 奥乃 博, 諸橋 峰雄, 京田 耕司, 中臺 一博
産業図書   2001年   ISBN:4782851502
Humanoid Active Audition System Improved by The Cover Acoustics
Springer-Verlag   2000年   
Rosenthal David F., 奥乃 博
Lawrence Erlbaum Associates, NJ, U.S.A.   1998年   ISBN:0805822836

講演・口頭発表等

 
杉山 治, 糸山 克寿, 中臺 一博, 奥乃 博
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   2014年6月16日   
本研究では、ロボット聴覚ソフトウェアHARKに基づいた多方向音声のアノテーションツールの開発について述べる。多方向の音声情報を視覚化し分かりやすく提示する既存研究は存在するが、提示された情報をラベル付けし、セマンティックにアノテーションするまでを一括して行うツールはまだ提案されていない。本研究では、HARKによって音源定位・分離された多方向音声をアノテーションするツールを開発し、アノテーションの負荷を軽減するためにSVMに基づく、自動補完機能を実装した。そして、被験者実験を通じて、その有効...
糸原 達彦, 奥乃 博
電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット : IEICE technical report   2012年10月4日   
本研究では,ロボットやシステム間での通信のためのパッケージであるROS(Robot Operating System)を用いた,人と同期した演奏を行うロボットのためのシステム構築について述べる.従来開発されてきた同期演奏技術では視覚及び聴覚情報処理を行う必要があるが,ロボット単独ではリアルタイム計算という観点から,その実現は困難である.そこで同期演奏技術をROSを介した分散システムとして統合し,高拡張性を持つ合奏システムを開発したのでそれを報告する.また,分散システムに不可避な遅延や合奏の...
矢澤一樹, 阪上大地, 糸山克寿, 奥乃博
研究報告音楽情報科学(MUS)   2012年8月2日   
本稿は,ギター演奏者の押弦・運指に関する制約を用いたタブ譜自動生成システムについて報告する.我々は,潜在的調波配分法 (LHA) の推定結果に押弦・運指制約を加えることで,演奏不可能な音の組合せを排除する.押弦制約として,あらかじめ列挙した演奏可能な押弦パターンの中から各時間フレームでの最適パターンを推定し,その押弦パターンで演奏可能な音のみを抽出する.これにより,演奏可能な押弦パターンのみで構成されたタブ譜を出力することができる.また,運指制約として編集距離に基づく運指のコストを用いて,...

Works

 
ロボット聴覚オープンソフトウエアHARK
奥乃 博   コンピュータソフト   2008年12月 - 現在
HARKはマイクロフォンアレイによる複数音源の音源定位,音源分離,分離音認識を実時間で処理するソフトウエアツール群です.2018年7月現在13万回超のダウンロード.Windows, Linuxで使用可能.
音楽情報処理
2000年 - 2001年
環境音認識・擬音語認識
2001年 - 2003年
環境音の自動認識
2004年 - 2005年

競争的資金等の研究課題

 
ヒューマノイドのためのアクティブ・オーディションを用いた音環境理解の研究
科学研究費補助金
研究期間: 2003年 - 2007年
GDA文書タグの自動変換とその応用システム開発の研究
科学研究費補助金
研究期間: 2001年 - 2004年
聴覚・視覚の複数レベル実時間情報統合の研究
科学研究費補助金
研究期間: 2001年 - 2004年
脳のモデルを用いた自己生成音抑制機能を備えた聴覚機能の研究
科学研究費補助金
研究期間: 2001年 - 2003年
音オントロジーによる音楽情報処理研究
科学研究費補助金
研究期間: 2000年 - 2003年
ロボット聴覚,情報統合

特許

 
ジョアオ ロバート オリベイラ, インジュ ギョカン, 中村 圭佑, 中臺 一博, 奥乃 博, ルイス パウロ レイシュ, ファビアン グーヨン
中臺 一博, 中村 圭佑, 山村 祐介, 奥乃 博
中野 幹生, 船越 孝太郎, 駒谷 和範, 奥乃 博, 佐藤 隼
中臺 一博, 中島 弘史, 奥乃 博, 武田 龍
中野 幹生, 勝丸 真樹, 船越 孝太郎, 奥乃 博
堀邊 隆介, 梅田 修志, 田中 史記, 猪田 岳司, 奥乃 博, 高橋 徹
安部 武宏, 安良岡 直希, 糸山 克寿, 奥乃 博
中野 幹生, 辻野 広司, 竹内 誉羽, 駒谷 和範, 奥乃 博

その他

 
ミドルネームあり.すべての論文に使用

http://www.aoni.waseda.jp/okuno/ に全情報があります.