Closed2
OpenAIのWhisperをMacbook Airで動かしてみる
Whisperのリポジトリ
READMEにインストール手順が書いてある
Pythonで文字起こしする
使いたいモデルをロードして、音源のパスを指定して文字起こしを実行する
result["text"]
には文字起こしされたテキストが1行で格納されている
import whisper
model = whisper.load_model("turbo")
result = model.transcribe("audio.mp3")
print(result["text"])
result["segments"]
にはセグメント情報が格納されている
for segment in result["segments"]:
# セグメントの開始時間、終了時間も格納されている
print(f"[{segment['start']} - {segment['end']}]: {segment['text']}\n")
このスクラップは4ヶ月前にクローズされました