Open16

VOICEPEAK for Mac 使ってみたメモ

𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

調査項目

コマンドラインツールとして

  • 呼び出せるのか(古い情報が多いので BigSur でも使えるかとか)
  • 制限(文字数とかエモートとか)
  • 引数とGUIとの対応表(早見表にできたらいいな)
  • ファイルとして書き出さずにBufferを直接受け取れないか
  • 文字数が分割されるとして、文ごとに読み上げを分断させない方法がないか
  • オプションの取得など読み上げ出力以外のコマンドはあるか

字幕

  • 読み上げ用の原稿はどのくらいチューニングが必要か
  • 字幕と読み上げの原稿はどのように管理するか
𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖
  • macOS Sonoma 14.3.1
  • Voicepeak 1.2.9
/Applications/voicepeak.app/Contents/MacOS/voicepeak -h
Voicepeak
Usage:
  /Applications/voicepeak.app/Contents/MacOS/voicepeak [OPTION...]

  -s, --say Text               Text to say
  -t, --text File              Text file to say
  -o, --out File               Path of output file
  -n, --narrator Name          Name of voice, check --list-narrator
  -e, --emotion Expr           Emotion expression, for example: 
                               happy=50,sad=50. Also check --list-emotion
      --list-narrator          Print voice list
      --list-emotion Narrator  Print emotion list for given voice
  -h, --help                   Print help
      --speed Value            Speed (50 - 200)
      --pitch Value            Pitch (-300 - 300)
𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖
/Applications/voicepeak.app/Contents/MacOS/voicepeak -s "ハローワールド" -n "Miyamai Moca"

output.wav でファイルが出力される( -o オプションで変更可能)

𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖
/Applications/voicepeak.app/Contents/MacOS/voicepeak -s "ハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールド"
In this version, the character limit for a single run is 140 characters, but the input string contains 147 characters.

引き続き、CLIからのリクエストは 140 文字上限あり

𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

実行時の警告

/Applications/voicepeak.app/Contents/MacOS/voicepeak -s "ハロー"

正常にアウトプットされるが、警告が表示される

iconv_open is not supported
iconv_open is not supported
iconv_open is not supported
2024-02-15 20:21:20.153 voicepeak[44322:4241048] WARNING: Secure coding is not enabled for restorable state! Enable secure coding by implementing NSApplicationDelegate.applicationSupportsSecureRestorableState: and returning YES.

これなに

わからんけど、コーディングがセキュアではないみたいなものっぽい(悪意を持たれたら危ない的な)

𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

CLI ちょっと触った所感

  • VOICEPEAK 自体、イントネーションやアクセントを調整したほうが良いケースが散見される
  • 140文字以下はかなり厳しい
  • ただ自動読み上げとかのために使うのは全然アリな品質ではある
𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

キーボードショートカット

以下の機能にショートカットを設定できる。
すべて自由に変更できる。

  • 新規プロジェクト
  • ファイルを開く
  • SRTファイルを開く
  • テキストファイルを開く
  • CSVファイルを開く
  • プロジェクトの保存
  • 名前を付けてプロジェクトを保存
  • 出力
  • ブロック出力
  • ボイスの置換
  • ライセンスとアップデート
  • 環境設定
  • キー設定
  • 更新の確認
  • バージョン情報
  • マニュアル
  • 辞書
  • 元に戻す
  • やり直す ×2
  • 速さパネルの表示
  • ピッチパネルの表示
  • ポーズパネルの表示
  • 感情パネルの表示
  • 再生/停止 ×2
  • 現在のブロックを再生
  • 先頭に移動
  • 末尾に移動
  • 前のブロックへ移動 ×2
  • 次のブロックへ移動 ×2
  • コピー
  • ペースト
  • 切り取り
  • すべてを選択
𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

Tips (随時更新)

  • 音声を再生すると、再生開始位置に戻らないので、 Cmd+B で「現在のブロックを再生」から再生するのが楽
  • プロジェクトの保存データ( .vpp )ファイルは中身がJSONなので Git で差分管理できる
𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

みゃーまい Tips(随時更新)

  • 朗読のおすすめ設定
    • 感情
      • ぼそぼそ = 25%
      • ドヤる = 40%
      • ほんわか = 20%
      • 怒り = 0%
      • 泣き = 0%
    • ポーズ = 70%
    • ピッチ = 35%
    • 速度 = 120%
𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖𝕤𝕚𝕞𝕠𝕔𝕙𝕖𝕖

SofTalk みたいな読み上げ指示文字みたいなものはなさそうで、GUIから調整する以外に方法はなさそう
(プロジェクトデータが JSON なのでプログラマティックに調整はできそう)