HuBERT
HuBERT
Определение
Self-supervised аудио encoder на основе CNN и transformer, устойчивый к шуму, используется для ASR и обработки аудио-канала.
Где встречается
- 543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)
- 549. Как вы проектируете систему для real-time video understanding (поток с камеры)