Open1

音声合成を試す(RVC、Vits)

kazuphkazuph

Latopiaを試す

https://github.com/ddPn08/Latopia

Dockerで環境構築

FROM nvidia/cuda:11.8.0-cudnn8-devel-ubuntu22.04
RUN apt update && apt install -y python3 python3-pip

WORKDIR /app

COPY requirements.txt .
RUN pip3 install torch torchaudio --index-url https://download.pytorch.org/whl/cu118
RUN pip3 install -r requirements.txt

COPY . .
RUN python3 setup.py develop

CMD ["latopia", "webui"]
version: '3.9'
services:
  app:
    tty: true
    deploy:
      resources:
        reservations:
          devices:
              - driver: nvidia
                device_ids: ['0']
                capabilities: [compute, utility]
    build:
      context: .
      dockerfile: "Dockerfile"
    volumes:
      - .:/app
      # - python-packages:/root/.local/share
    ports:
      - "7862:8000"

volumes:
  # python-packages:

実行する

sudo docker compose up --build

docker-composeファイルで指定したポートでアクセスする。

URLが不正ですhttps://<起動したサーバーのIP>:7862

起動した。

一旦ここまで。

ちなみにREADME.mdにある

pretrained_model_path = "./models/checkpoints/vits/pretrained-40k.g.safetensors"
pretrained_discriminator_path = "./models/checkpoints/vits/pretrained-40k.d.safetensors"

がどのファイルを示しているのか現在わかっていない。 f0G40k.pthとか はRVCを試すときにみたので、それを指定すればいいのだろうか?(safetensorsに変換しなければならない?)