Open5

全くわからんけど自分の歌声DBをつくって,NNSVSで音声合成したい

歌声DBとは

https://km4osm.com/singingvoicedb/
からの引用

機械学習用の素材として使うことを想定した(部分もある)歌声をまとめたデータベース。約50曲分の歌声音声WAVEと楽譜、ラベルデータなんかが含まれる。

歌声DBがあると何が良いの?

機械学習を行うことで、自分の声をもとにした歌声が合成できるようになる

具体例

https://youtu.be/dXfDD5eKDkw

最終的な目標

歌声DBをつくって、機械学習を行いモデルを作成し、自分の歌声を合成できるようにしたい

歌声DBを活かす方法

NNSVSモデルを作成して、UTAUとENUNUプラグインつかうことで歌声を合成できる

歌声DB制作チュートリアル

https://twitter.com/chiteico/status/1475483630835474433?s=21

ざっと読んでみて気になった点

50曲分の歌声DBの制作時間は、実務作業だけで100~200時間程度を想定している。

50曲ならいけそう!と思ってましたがデータ処理などの実務処理ですごい時間を使うので大変そうです。
またいろんなツールを使うのですが、そのツールの使い方をまなびながらだとさらに時間がかかりそうです。

ログインするとコメントできます