Closed2

OpenAIのWhisperをMacbook Airで動かしてみる

tapontapon

Pythonで文字起こしする

使いたいモデルをロードして、音源のパスを指定して文字起こしを実行する
result["text"]には文字起こしされたテキストが1行で格納されている

import whisper

model = whisper.load_model("turbo")
result = model.transcribe("audio.mp3")
print(result["text"])

result["segments"]にはセグメント情報が格納されている

for segment in result["segments"]:
    # セグメントの開始時間、終了時間も格納されている
    print(f"[{segment['start']} - {segment['end']}]: {segment['text']}\n")
このスクラップは4ヶ月前にクローズされました