Whisperで遊ぶ

ハードウェア
- CPU：Intel Core i7 13700K
- グラフィックボード：GeForce RTX 3700 (8GB)
- メモリー：16GB（DDR4 2666MHz 8GB × 2枚）
- マザーボード：ASUS TUF Gaming Z690-Plus WiFi D4
モデル：medium
ファイル：examples_full_usage_2830-3980-0043.wav（英語）

whisper-rs

whisper-rs-demo\target\debug\whisper-rs-demo.exe ..\examples_full_usage_2830-3980-0043.wav D:\whisper\ggml-medium.bin

 whisper examples_full_usage_2830-3980-0043.wav --model medium --device cpu--model_dir D:\whisper

 whisper examples_full_usage_2830-3980-0043.wav --language en --model medium --device cpu --model_dir D:\whisper

 whisper examples_full_usage_2830-3980-0043.wav --model medium --device cuda --model_dir D:\whisper

 whisper examples_full_usage_2830-3980-0043.wav --language en --model medium --device cuda --model_dir D:\whisper

より拝借。

whisper-rsのサンプルコードに読ませるにあたって、16bit 16KHz モノラルでなければいけないのでffmpegで変換を行った。

 ffmpeg -i D:\audio_samples\VOICEACTRESS100_094.wav -ar 16000 -acodec pcm_s116le -ac 1 D:\audio_samples\VOICEACTRESS100_094_converted.wav

target\debug\whisper-rs-demo.exe D:\audio_samples\VOICEACTRESS100_094.wav D:\whisper\ggml-medium.bin

whisper D:\audio_samples\VOICEACTRESS100_094.wav --model medium --device cpu --model_dir D:\whisper --lang ja

whisper D:\audio_samples\VOICEACTRESS100_094.wav --model medium --device cuda --model_dir D:\whisper --language ja

メモリを16GBから64GBに増設して再度テスト。全体的に大幅にスピードが上がった

ハードウェア
- CPU：Intel Core i7 13700K
- グラフィックボード：GeForce RTX 3700 (8GB)
- メモリー： 64GB（DDR4 3200MHz 32GB × 2枚）
- マザーボード：ASUS TUF Gaming Z690-Plus WiFi D4
モデル：medium
ファイル：VOICEACTRESS100_094.wav（日本語）

 ffmpeg -i D:\audio_samples\VOICEACTRESS100_094.wav -ar 16000 -acodec pcm_s116le -ac 1 D:\audio_samples\VOICEACTRESS100_094_converted.wav

target\debug\whisper-rs-demo.exe D:\audio_samples\VOICEACTRESS100_094.wav D:\whisper\ggml-medium.bin

whisper D:\audio_samples\VOICEACTRESS100_094.wav --model medium --device cpu --model_dir D:\whisper --lang ja

whisper D:\audio_samples\VOICEACTRESS100_094.wav --model medium --device cuda --model_dir D:\whisper --language ja