Closed11
「PicoVoice」のサービス・製品一覧
自分は、有償のウェイクワードエンジン「Porcupine」のベンダーとして認識しているが、音声関連のいろいろなサービスや製品を扱っているようなので、少し調べてみる。
STT
STTは2つの製品がある
- Leopard
- Cheetah
Leopard
- オンデバイスSTTエンジン
- 有償(アクセスキーが必要)
- 日本語対応(商用ユーザにはユースケースに合わせて対応言語以外のサポートあるらしい)
Cheetah
- オンデバイスストリーミングSTTエンジン
- 有償(アクセスキーが必要)
- 日本語非対応(商用ユーザにはユースケースに合わせて対応言語以外のサポートあるらしい)
TTS
TTSは1製品
- Orca
Orca
- オンデバイスTTSエンジン
- 有償(アクセスキーが必要)
- 日本語非対応(商用ユーザにはユースケースに合わせて対応言語以外のサポートあるらしい)
ノイズ抑制
ノイズ抑制は1製品
- Koala
Koala
- オンデバイスノイズ抑制エンジン
- 有償(アクセスキーが必要)
話者認識・話者分離
話者認識・話者分離はそれぞれ1製品
- Eagle(話者認識)
- Falcon(話者分離)
Eagle
- オンデバイス話者認識エンジン
- 有償(アクセスキーが必要)
- 言語依存なし
Falcon
- オンデバイス話者分離エンジン
- 有償(アクセスキーが必要)
音声検索
音声検索(Speech-to-Index: テキスト化せずに音声でキーワード検索)は1製品
- Octopus
Octopus
- 音声検索エンジン
- 有償(アクセスキーが必要)
- 日本語対応
ウェイクワード
ウェイクワードは1製品
- Porcupine
Porcupine
- オンデバイスウェイクワードエンジン
- 有償(アクセスキーが必要)
- 学習はPicoVoiceプラットフォーム上でのみ
- 日本語対応
インテント判別
インテント判別(Speech-to-Intent)は1製品
- Rhino
Rhino
- オンデバイスインテント判別エンジン
- 有償(アクセスキーが必要)
- 日本語対応
音声活動検出(VAD)
VADは1製品
- Cobra
Cobra
- オンデバイスインテント判別エンジン
- 有償(アクセスキーが必要)
LLM
LLMは3製品
- picoLLM Inference
- picoLLM Compression
- picoLLM GYM
ちょっとここははっきりしない
picoLLM Inference
- 推論エンジン
- オープンウェイトモデルは無料?
picoLLM Compression
- モデル量子化
picoLLM GYM
- モデルのファインチューニング
料金
無料プランも一応あるが、ざっと見た限り、基本的にすべて有償サービスで、あとお値段もなかなか・・・
- Foundationプラン: $6000/年
- Enterprise: $30000/年
あと、サービスごとの従量課金みたいなのがないので、例えばTTSだけ使いたいのに、他のサービスもまとめての料金、という感じに見えるので、ガッツリプラットフォームに乗っかるとかじゃないと使いにくいかなぁ・・・
このスクラップは2025/02/22にクローズされました