Open3
リアルタイム文字起こし
Whisper
ローカルでのリアルタイム文字起こしは可能だが、APIでのリアルタイム文字起こしは実装されていない。
AWS
WebSocketでリアルタイム文字起こしが可能か
gRPCでリアルタイム文字起こしが可能か
まとめ
- AWSやGoogleの文字起こしを使えば、リアルタイム文字起こしが可能。通信速度によるが、おそらく2,3秒でレスポンスが返ってくるはず。
- WhisperのAPIはリアルタイム文字起こしに対応していない。音声の区切り目を待ってからor一定時間待ってから音声データを送る必要があるため、発言してから最大10秒以上の遅れ。
- WhiperをAPIで使わずサーバーで立ち上げる場合はリアルタイム文字起こし可能