Open3

リアルタイム文字起こし

sergicalsixsergicalsix

まとめ

  • AWSやGoogleの文字起こしを使えば、リアルタイム文字起こしが可能。通信速度によるが、おそらく2,3秒でレスポンスが返ってくるはず。
  • WhisperのAPIはリアルタイム文字起こしに対応していない。音声の区切り目を待ってからor一定時間待ってから音声データを送る必要があるため、発言してから最大10秒以上の遅れ。
  • WhiperをAPIで使わずサーバーで立ち上げる場合はリアルタイム文字起こし可能