Closed8
whisperを使ってみたい
音声認識モデルのWhisperがすごい、と言うことを聞いて気になったので使ってみたい。何も知らないけど調べながらやっていくぞ〜!
pythonの環境が必要ぽい?Dockerで準備できるかな
pytorchって名前はよく見るけど何者なんだ
『PyTorch』とは、Facebookが開発を主導したPython向けの機械学習ライブラリです
へぇ!
こちらを参考に見ている
Dockerでの環境構築も書かれていたのでこっちを見てる
Slackの文字起こしもすごいなぁ、どうやってるんだろう
root@26cda843b304:/workspace# whisper test.m4a --language ja
100%|███████████████████████████████████████| 461M/461M [00:06<00:00, 74.1MiB/s]
/usr/local/lib/python3.9/site-packages/whisper/transcribe.py:114: UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead")
[00:00.000 --> 00:07.000] これはテストです。音声の録音テストです。これで終了します。
最初の「あ〜〜」は録音されてないけど「これはテストです。音声の録音テストです。これで終了します。」は文字起こしできた!!すごい〜〜!!
このスクラップは2023/03/25にクローズされました