Closed11

何も分からなかった頃のメモ:rvc

daraiiidaraiii

links

youtube投稿

rvcのvstプラグインがあると便利。現状はなさそう。できればその作成に貢献したい

配信用tips

daraiiidaraiii

windows10 環境構築(webui-user.bat)はまりどころ

  1. visual stadio installerでcpp 14以上を入れておく
  2. python3.10である必要(3.11じゃだめ)

1

Installing requirements
Traceback (most recent call last):
  File "C:\Users\darai0512\Downloads\rvc-webui\launch.py", line 138, in <module>
    prepare_environment()
  File "C:\Users\darai0512\Downloads\rvc-webui\launch.py", line 119, in prepare_environment
    run(
  File "C:\Users\darai0512\Downloads\rvc-webui\launch.py", line 36, in run
    raise RuntimeError(message)
...
(omission)
...
  error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/
  [end of output]

  note: This error originates from a subprocess, and is likely not a problem with pip.
  ERROR: Failed building wheel for fairseq
  error: subprocess-exited-with-error

  Building wheel for pyworld (pyproject.toml) did not run successfully.
  exit code: 1

  [29 lines of output]
  C:\Users\darai0512\AppData\Local\Temp\pip-build-env-j852msb5\overlay\Lib\site-packages\setuptools\dist.py:498: SetuptoolsDeprecationWarning: Invalid dash-separated options
  !!
...(omission)...
  note: This error originates from a subprocess, and is likely not a problem with pip.
  ERROR: Failed building wheel for pyworld
ERROR: Could not build wheels for fairseq, pyworld, which is required to install pyproject.toml-based projects

2

...
ValueError: mutable default <class ‘fairseq.dataclass.configs.CommonConfig’> for field common is not allowed: use default_factory
daraiiidaraiii

以下終わらず

sampling rate = 48k
v2
cpu threads = 12
学習用データ ずんだもんコーパス 1.5Mb * 4600ファイル
rmvpe_gpu
save per epoch = 15
total epoch = 100
GPU batch size = 15
no
cache = yes <- これがあやしい
no

daraiiidaraiii

配信Tips
cubase
input=自分のmic
output=Vertual Audio Cable
とすべきだが、テスト目的で
output=ヘッドフォン
としてから上に切り替えるとinputのモニタリングができなくなる。

daraiiidaraiii

配信Tips
VACは有料版ならLineはVirtual Audio Cable Control Panelから複数本作れる。
https://vac.muzychenko.net/en/manual/features.htm#demolimit
VB-Cableも寄付で増やせる。

なので例えば、OBSでマイクをモニターのみ出力させ、マイクのフィルタでStudioRack+rx 10などでノイズキャンセリングし、モニター出力をLine1に流し、Line1をinputでAIボイチェンクライアントに流し、outputをLine2、OBSの音声入力キャプチャでLine2を流す、とか可能。
(AIボイチェンクライアントをvstプラグイン化したい。BeatriceがOSS化されないなら開発モチベあり。)

無料でやるならVAC+VB-Cable

daraiiidaraiii

by いたりん

RVCモデル間の類似度を計算する簡易スクリプト。単なるコサイン類似度。
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/commit/064fecbd5dcdd4c1f86612ce6f74c0bee37b9963

同一話者による違うデータセットから作ったモデルでは類似度はそこまで高くない。
しかし2つのモデルをマージしたものと元のモデルとの類似度は明確に高くなる。
モデルマージチェックには使える可能性がある。

daraiiidaraiii

データ整形

$python audio_to_copas.py --input ../b.wav --outdir ./copas --time 10 --rate 50
$python separate_in_speach.py --input_dir ./copas --min 5000 --max 10000 --out_dir ./out --padding true
daraiiidaraiii

RVC学習ノウハウ

GPU占有メモリが上限に張り付くと処理が止まる。設定値の見極めが大事。

rtx4070の場合のメモ

止まる
input=750files, 60min超
cache=false <= 10minが目安
CPU threads=12
GPU batch size=12 => 10Gb/12Gb

このスクラップは2024/05/12にクローズされました