Closed11

「PicoVoice」のサービス・製品一覧

kun432kun432

自分は、有償のウェイクワードエンジン「Porcupine」のベンダーとして認識しているが、音声関連のいろいろなサービスや製品を扱っているようなので、少し調べてみる。

https://picovoice.ai/

kun432kun432

STT

STTは2つの製品がある

  • Leopard
  • Cheetah

Leopard

https://picovoice.ai/platform/leopard/

https://github.com/Picovoice/leopard

  • オンデバイスSTTエンジン
  • 有償(アクセスキーが必要)
  • 日本語対応(商用ユーザにはユースケースに合わせて対応言語以外のサポートあるらしい)

Cheetah

https://picovoice.ai/platform/cheetah/

https://github.com/Picovoice/cheetah

  • オンデバイスストリーミングSTTエンジン
  • 有償(アクセスキーが必要)
  • 日本語非対応(商用ユーザにはユースケースに合わせて対応言語以外のサポートあるらしい)
kun432kun432

話者認識・話者分離

話者認識・話者分離はそれぞれ1製品

  • Eagle(話者認識)
  • Falcon(話者分離)

Eagle

https://picovoice.ai/platform/eagle/

https://github.com/Picovoice/eagle

  • オンデバイス話者認識エンジン
  • 有償(アクセスキーが必要)
  • 言語依存なし

Falcon

https://picovoice.ai/platform/falcon/

https://github.com/Picovoice/falcon

  • オンデバイス話者分離エンジン
  • 有償(アクセスキーが必要)
kun432kun432

料金

https://picovoice.ai/pricing/

無料プランも一応あるが、ざっと見た限り、基本的にすべて有償サービスで、あとお値段もなかなか・・・

  • Foundationプラン: $6000/年
  • Enterprise: $30000/年

あと、サービスごとの従量課金みたいなのがないので、例えばTTSだけ使いたいのに、他のサービスもまとめての料金、という感じに見えるので、ガッツリプラットフォームに乗っかるとかじゃないと使いにくいかなぁ・・・

このスクラップは2025/02/22にクローズされました