whisperを使ってみたい

nissyi 2023/03/25

音声認識モデルのWhisperがすごい、と言うことを聞いて気になったので使ってみたい。何も知らないけど調べながらやっていくぞ〜！

nissyi 2023/03/25

pythonの環境が必要ぽい？Dockerで準備できるかな

nissyi 2023/03/25

pytorchって名前はよく見るけど何者なんだ

nissyi 2023/03/25

『PyTorch』とは、Facebookが開発を主導したPython向けの機械学習ライブラリです

へぇ！

nissyi 2023/03/25

こちらを参考に見ている

nissyi 2023/03/25

Dockerでの環境構築も書かれていたのでこっちを見てる

nissyi 2023/03/25

Slackの文字起こしもすごいなぁ、どうやってるんだろう

nissyi 2023/03/25

root@26cda843b304:/workspace# whisper test.m4a --language ja
100%|███████████████████████████████████████| 461M/461M [00:06<00:00, 74.1MiB/s]
/usr/local/lib/python3.9/site-packages/whisper/transcribe.py:114: UserWarning: FP16 is not supported on CPU; using FP32 instead
  warnings.warn("FP16 is not supported on CPU; using FP32 instead")
[00:00.000 --> 00:07.000] これはテストです。音声の録音テストです。これで終了します。

最初の「あ〜〜」は録音されてないけど「これはテストです。音声の録音テストです。これで終了します。」は文字起こしできた！！すごい〜〜！！