基本情報

所属
国立研究開発法人産業技術総合研究所 情報・人間工学領域 人工知能研究センター 研究員
学位
博士(工学)(2022年3月 東京大学)

連絡先
suda.haist.go.jp
研究者番号
60981438
ORCID iD
 https://orcid.org/0000-0003-2648-363X
J-GLOBAL ID
202301010145949690
researchmap会員ID
R000049521

外部リンク

 


音声・音楽分野の研究からプロダクト開発まで、なんでもやるフルスタックエンジニア。 

音声分野の研究者コミュニティ向け Discord サーバ「onsei-discord」設立者兼管理人。


研究分野

  • 入力された音声を別の人の声にできる声質変換技術
  • アイドルユニットなどの楽曲から「いつ誰が歌っているか」を推定する歌唱者ダイアライゼーション技術
  • 音楽・音声情報処理技術を活用した音楽鑑賞アプリケーション

開発コーパス

  • CocoNut-Humoresque
    • 1800 の音声(各およそ 4 秒)に、11 人以上の聴取者による声質好感度を付与したコーパス
    • 声質の好感度推定、音声デザインなどに利用可能
  • FruitsMusic
    • YouTube 上のアイドルグループのミュージックビデオに対して「いつ誰が何を歌唱したか」を与えたコーパス
    • 歌詞認識、歌唱者ダイアライゼーション、歌唱者埋め込み表現の評価など、様々な用途に利用可能

開発ソフトウェア(須田仁志名義)

  • VocalRemixer 2
    • アイドルユニットの楽曲の「歌割り」を変えられる音楽鑑賞アプリケーション

技術スタック

  • Ruby
  • Python / Pytorch
  • JavaScript / TypeScript / React / Next.js
  • Go
  • Kubernetes
  • MySQL / MariaDB
  • Prometheus / Grafana
  • Google Cloud Platform(App Engine、Cloud Run、Firestore、etc.)

SNS


講演・口頭発表等

  1

主要な論文

  23

主要なMISC

  4

所属学協会

  4

主要な共同研究・競争的資金等の研究課題

  1