MMVCのボイスチェンジャーを使う方法(詳細)
MMVCのボイスチェンジャーを使う方法について説明します。
ここではMMVCのヘルパーアプリであるVC Helperの操作の詳細を説明します。こちらのクイックスタートを読み終わっていることを想定しています。
VC Helperのソフトウェアの概要やダウンロードについてはこちら。
画面構成
プラットフォームに応じたアプリケーションの起動を行うとブラウザで次の画面が表示されます。この画面でMMVCのコントロールを行います。
サーバコントロールエリア
ボイチェンの開始、停止を操作します。
また、monitor部分で動作状況を表示します。
Model Infoの部分では、現在ロードされているモデルが表示されます。
モデルがロードされているにもかかわらず表示が行われない場合はreloadボタンを押してください。
サーバセッティングエリア
モデルのアップロードと使用するフレームワークを指定します。
モデルのアップロードを行うには、configファイルと一つ以上のモデルファイルを指定する必要があります。configファイルの拡張子は.jsonである必要があります。PyTorchのモデルファイルの拡張子は.pthである必要があります。Onnxのモデルファイルの拡張子は.onnxである必要があります。selectボタンを押して各ファイルを選択してください。
clearボタンを押すと選択を解除することができます。
configファイルとモデルファイルを選択したらuploadボタンを押してファイルをアップロードします。アップロード中は進捗が表示されます。この表示が消えたらアップロード完了です。
アップロードが完了したら、アップロードしたモデルファイルに対応するFrameworkを選択してください。Onnxを選択した場合は、更にOnnxExecutorProviderの選択が必要となります。WindowsでGPUを使用する場合はCUDAExecutionProviderを選択してください。DirectMLを使用する場合はDmlExecutionProviderを選択してください。Macの場合はCPUExecutionProviderを選択してください。
デバイスセッティングエリア
マイク(Audio Input)とスピーカー(Audio Output)の設定をします。
(3-1) マイク選択
使用可能なマイクの選択ではマイクに加えて音声ファイルの指定もできます。
ファイルを指定した場合は、音声プレイヤーが表示されます。
右のloadボタンで音声ファイルを選択してください。echobackにチェックを入れると返還前の音声も再生されます。不要の場合はチェックを外してください。
(3-2) スピーカー選択
出力先のスピーカーを選択します。
Voice Meterなどの仮想ケーブルがインストールされている場合は、それらを選択することができます。
スピーカーセッティングエリア
変換元の話者と変換先の話者を設定します。
Source Speaker idが変換元の話者のIDになります。Destination Speaker idが変換先の話者のIDになります。
デフォルトで表示されるIDは公式推奨の方法でトレーニングを行った場合のIDです。カスタマイズしている場合はEdit Speaker Mappingの部分で、IDと話者を対応付けることができます。
変換セッティングエリア
変換にかかわる設定を行います。
Input Chunk Numで、変換用にバッファリングするサイズを指定することができます。大きな値ほど変換の効率(≒全体の処理速度)が良くなりますが、変換のタイムラグが大きくなります。
GPUの部分で使用するGPUを指定します。PyTorchを使用している場合は-1にするとCPUを使用して変換が行われます。
アドバンストセッティングエリア
より高度な設定を行うことができます。デフォルトでは表示されていません。表示する場合はshowをチェックしてください。
Discussion