Closed2

Whisperを独自用語でファインチューニング

kun432kun432

とてもありがたい。

https://zenn.dev/k_sone/articles/e0c08268986ac2

前編はできた。オーディオソースにもよるのだろうけど、Whisperに食わせるところで結構コケたりしたので、オーディオファイルから無音カット&分割のところはロジック変えた。

あとでnotebookをここに置いておく。

kun432kun432

前提

  • Colab Pro必須
    • GPU(標準でOK)
    • ハイメモリ

  • 使用したオーディオソース
    • 某競馬オンラインサロンの解説音声で専門用語多数。
    • 約2時間(1時間x2)
    • m4a
    • 音声はややこもり気味で収録環境はそれほど揃ってない(PCマイク使用?)と推測
このスクラップは2023/07/20にクローズされました