DeepSpeech
DeepSpeech
Определение
ASR-модель на основе RNN (LSTM) и CTC, устаревшая, но лёгкая. Используется для streaming, но уступает по качеству современным моделям.
Где встречается
- 364. Как вы строите real-time voice agent с latency 500ms
- 543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)
- 559. Что такое Audio RAG (RAG для аудиофайлов)