Open16
VOICEPEAK for Mac 使ってみたメモ
調査項目
コマンドラインツールとして
- 呼び出せるのか(古い情報が多いので BigSur でも使えるかとか)
- 制限(文字数とかエモートとか)
- 引数とGUIとの対応表(早見表にできたらいいな)
- ファイルとして書き出さずにBufferを直接受け取れないか
- 文字数が分割されるとして、文ごとに読み上げを分断させない方法がないか
- オプションの取得など読み上げ出力以外のコマンドはあるか
字幕
- 読み上げ用の原稿はどのくらいチューニングが必要か
- 字幕と読み上げの原稿はどのように管理するか
参考情報
まじで Mac の情報ないし、 CLI のオフィシャルなドキュメントもない。
- macOS Sonoma 14.3.1
- Voicepeak 1.2.9
/Applications/voicepeak.app/Contents/MacOS/voicepeak -h
Voicepeak
Usage:
/Applications/voicepeak.app/Contents/MacOS/voicepeak [OPTION...]
-s, --say Text Text to say
-t, --text File Text file to say
-o, --out File Path of output file
-n, --narrator Name Name of voice, check --list-narrator
-e, --emotion Expr Emotion expression, for example:
happy=50,sad=50. Also check --list-emotion
--list-narrator Print voice list
--list-emotion Narrator Print emotion list for given voice
-h, --help Print help
--speed Value Speed (50 - 200)
--pitch Value Pitch (-300 - 300)
/Applications/voicepeak.app/Contents/MacOS/voicepeak --list-narrator
Frimomen
Tsurumaki Maki
Miyamai Moca
/Applications/voicepeak.app/Contents/MacOS/voicepeak --list-emotion "Miyamai Moca"
bosoboso
doyaru
honwaka
angry
teary
/Applications/voicepeak.app/Contents/MacOS/voicepeak -s "ハローワールド" -n "Miyamai Moca"
output.wav
でファイルが出力される( -o
オプションで変更可能)
/Applications/voicepeak.app/Contents/MacOS/voicepeak -s "ハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールドハローワールド"
In this version, the character limit for a single run is 140 characters, but the input string contains 147 characters.
引き続き、CLIからのリクエストは 140 文字上限あり
実行時の警告
/Applications/voicepeak.app/Contents/MacOS/voicepeak -s "ハロー"
正常にアウトプットされるが、警告が表示される
iconv_open is not supported
iconv_open is not supported
iconv_open is not supported
2024-02-15 20:21:20.153 voicepeak[44322:4241048] WARNING: Secure coding is not enabled for restorable state! Enable secure coding by implementing NSApplicationDelegate.applicationSupportsSecureRestorableState: and returning YES.
これなに
わからんけど、コーディングがセキュアではないみたいなものっぽい(悪意を持たれたら危ない的な)
CLI ちょっと触った所感
- VOICEPEAK 自体、イントネーションやアクセントを調整したほうが良いケースが散見される
- 140文字以下はかなり厳しい
- ただ自動読み上げとかのために使うのは全然アリな品質ではある
宮舞モカのボイスはめちゃくちゃかわいい ←大事
キーボードショートカット
以下の機能にショートカットを設定できる。
すべて自由に変更できる。
- 新規プロジェクト
- ファイルを開く
- SRTファイルを開く
- テキストファイルを開く
- CSVファイルを開く
- プロジェクトの保存
- 名前を付けてプロジェクトを保存
- 出力
- ブロック出力
- ボイスの置換
- ライセンスとアップデート
- 環境設定
- キー設定
- 更新の確認
- バージョン情報
- マニュアル
- 辞書
- 元に戻す
- やり直す ×2
- 速さパネルの表示
- ピッチパネルの表示
- ポーズパネルの表示
- 感情パネルの表示
- 再生/停止 ×2
- 現在のブロックを再生
- 先頭に移動
- 末尾に移動
- 前のブロックへ移動 ×2
- 次のブロックへ移動 ×2
- コピー
- ペースト
- 切り取り
- すべてを選択
Tips (随時更新)
- 音声を再生すると、再生開始位置に戻らないので、 Cmd+B で「現在のブロックを再生」から再生するのが楽
- プロジェクトの保存データ( .vpp )ファイルは中身がJSONなので Git で差分管理できる
みゃーまい Tips(随時更新)
- 朗読のおすすめ設定
- 感情
- ぼそぼそ = 25%
- ドヤる = 40%
- ほんわか = 20%
- 怒り = 0%
- 泣き = 0%
- ポーズ = 70%
- ピッチ = 35%
- 速度 = 120%
- 感情
SofTalk みたいな読み上げ指示文字みたいなものはなさそうで、GUIから調整する以外に方法はなさそう
(プロジェクトデータが JSON なのでプログラマティックに調整はできそう)