stt
このトピックを指定するには
stt
と入力
Articles
0
Scraps
30
scraps
Trending
Alltime
Latest
speech-embeddingを使用した軽量ウェイクワード実装「local-wake」を試す
Closed
kun432
1ヶ月前にクローズ
#
stt
#
localwake
#
Speech to Text
#
asr
#
wakeword
9
Mistralの音声認識モデル「Voxtral」を試す
Closed
kun432
2ヶ月前にクローズ
#
stt
#
Speech to Text
#
asr
#
voxtral
#
mistral
7
音声から感情や音声イベントなども抽出できるASRモデル「SenseVoice」を試す
Closed
kun432
4ヶ月前にクローズ
#
stt
#
Speech to Text
#
asr
#
Alibaba
#
sensevoice
8
Soniox の Speech-to-Text を試す
Closed
kun432
4ヶ月前にクローズ
#
soniox
#
asr
#
stt
#
Speech to Text
12
aiOlaの高精度なASRモデル「Jargonic V2」
Closed
kun432
4ヶ月前にクローズ
#
stt
#
Speech to Text
#
jargonic
#
aiola
#
asr
11
Azure AI Speech ServiceのBatch transcription APIを試す(Python / Colab)
Closed
hosaka313
5ヶ月前にクローズ
#
stt
#
Azure
9
Deepgram の STT を試す
Closed
kun432
5ヶ月前にクローズ
#
voice
#
Agent
#
TTS
#
stt
#
Deepgram
10
GladiaのSTTモデル「Solaria」を試す
Closed
kun432
5ヶ月前にクローズ
#
gladia
#
solaria
#
asr
#
Speech to Text
#
stt
11
オフラインで使える音声認識ツールキット「VOSK」を試す
Closed
kun432
2025/03/16にクローズ
#
stt
#
Speech to Text
#
asr
#
Vosk
6
エンドツーエンド音声処理ツールキット「ESPnet」を試す
Closed
kun432
2025/03/15にクローズ
#
voice
#
asr
#
stt
#
TTS
#
ESPnet
9
ElevenLabs初のSpeech-to-Textモデル「Scribe」を試す
Closed
kun432
2025/02/27にクローズ
#
stt
#
Speech to Text
#
scribe
#
ElevenLabs
6
Pythonの音声認識モジュール「SpeechRecognition」を試す
Closed
kun432
2025/02/06にクローズ
#
Python
#
stt
#
SpeechRecognition
11
Faster Whisperを使ったSTTサーバ「Speaches」を試す
Closed
kun432
2025/02/05にクローズ
#
TTS
#
stt
#
Speech to Text
#
speaches
#
Whisper
11
あらためて「Google Cloud Speech-to-Text」を試す
Closed
kun432
2025/01/11にクローズ
#
asr
#
Speech to Text
#
stt
#
Google
10
STTをリアルタイムに近づけるライブラリ「RealtimeSTT」を試す
Closed
kun432
2024/12/26にクローズ
#
Speech to Text
#
stt
#
realtimestt
8
Cartesiaの高速なASRサービス「Ink-Whisper」を試す
Closed
kun432
3ヶ月前にクローズ
#
inkwhisper
#
cartesia
#
stt
#
Speech to Text
#
asr
5
NVIDIAのASRモデル「Parakeet」を試す
Closed
kun432
4ヶ月前にクローズ
#
NVIDIA
#
parakeet
#
stt
#
Speech to Text
#
asr
7
「MLX-Audio」を試す
Closed
kun432
4ヶ月前にクローズ
#
stt
#
TTS
#
Audio
#
MLX
#
macOS
5
「gpt-4o-transcribe」「gpt-4o-mini-transcribe」を試す
Closed
kun432
6ヶ月前にクローズ
#
asr
#
stt
#
Speech to Text
#
OpenAI
3
「Kotoba-Whisper-v2.2」を試す
Closed
kun432
2025/01/02にクローズ
#
Speech to Text
#
stt
#
Kotoba-Whisper
5
whisper-ctranslate2を試す
Closed
kun432
2023/05/23にクローズ
#
stt
#
ctranslate2
#
Whisper
5
「microWakeWord」を試す
Open
kun432
1ヶ月前にコメント追加
#
stt
#
Speech to Text
#
asr
#
microwakeword
#
wakeword
3
「WhisperLive」を試す
Open
kun432
2ヶ月前にコメント追加
#
stt
#
Speech to Text
#
Whisper
#
whisperlive
#
asr
4
[論文] Quantization for OpenAI's Whisper Models: A Comparative Analysis
Closed
kun432
2025/03/14にクローズ
#
stt
#
Speech to Text
#
asr
#
Whisper
#
論文
2
HuggingFaceの「speech-to-speech」実装を試す
Closed
kun432
2025/02/21にクローズ
#
LLM
#
TTS
#
stt
#
speechtospeech
#
Hugging Face
4
whisper-medusa-v1 を試す
Closed
kun432
2024/08/03にクローズ
#
AI
#
stt
#
Whisper Medusa
#
Whisper
4
「Speechmatics」のリアルタイム文字起こしを試す
Open
kun432
2ヶ月前にコメント追加
#
TTS
#
stt
#
asr
#
speechmatics
3
「Azure AI Speech」のリアルタイム文字起こしを試す
Open
kun432
2ヶ月前にコメント追加
#
stt
#
Speech to Text
#
asr
#
Azure AI Speech
#
Azure
1
あらためて「Amazon Transcribe」を試す
Closed
kun432
2025/02/06にクローズ
#
stt
#
Speech to Text
#
transcribe
#
AWS
5
Whisperを独自用語でファインチューニング
Closed
kun432
2023/07/20にクローズ
#
stt
#
Whisper
2