Поиск

wikiStreaming ASR
# Streaming ASR ## Определение Распознавание речи в реальном времени токен за токеном, используемое в voice-агентах для минимизации задержки. ## Где встречается…
wikiEncoder-decoder transformer
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…
wikiMultitask Learning
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…
wikiSpecAugment
# SpecAugment ## Определение Метод аугментации данных для аудио, заключающийся в маскировании частотных и временных полос спектрограммы для улучшения обобщения моделей ASR…
wikilog-Mel spectrogram
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…
wikiSuppress Tokens
…Используется, например, для исключения неречевых токенов в ASR. ## Где встречается - [[363. Как работает Whisper (architecture, tokenization, training) для ASR|363…
wikiwav2vec 2.0
# wav2vec 2.0 ## Определение ASR-модель от Meta на основе CNN и transformer encoder с self-supervised обучением и CTC…
wikireal-time factor
# real-time factor ## Определение Метрика производительности ASR: отношение времени обработки аудио к его длительности; значение меньше 1 означает ускорение (например…
wikiHuBERT
# HuBERT ## Определение Self-supervised аудио encoder на основе CNN и transformer, устойчивый к шуму, используется для ASR и обработки аудио…
wikiGELU
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…
wikiDeepSpeech
# DeepSpeech ## Определение ASR-модель на основе RNN (LSTM) и CTC, устаревшая, но лёгкая. Используется для streaming, но уступает по качеству…
answerКак вы строите real-time voice agent с latency <500ms?
…kind = "audio" async def recv(self): # Получение аудиочанка от WebRTC frame = await super().recv() # Отправка в ASR asr_queue.put…
answerКак вы строите real-time voice agent с latency <500ms?
…Основные компоненты: - [[Вики/Streaming ASR\|Streaming ASR]] — преобразует аудиопоток в текст по мере поступления. - [[Вики/LLM\|LLM]] — генерирует ответ, начиная…
answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?
…asr = evaluate_asr(model, attack_bank) print(f"Iteration {iteration}: ASR = {asr:.2%}") if asr < 0.05: break # Анализируем успешные…
wikiWhisperFeatureExtractor
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] ## Навигация - [[00. Индекс…
wikiWhisper
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[546. Как вы…
wikipiper.cpp
…Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…
wikiWhisper streaming
# Whisper streaming ## Определение Specific implementation of streaming ASR using OpenAI Whisper model. ## Где встречается - [[544. Как вы строите real-time…
wikiMel-спектрограмма
…Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…
wikiMel-шкала
…Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] ## Навигация…
wikiWord Error Rate
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[364. Как вы…
wikitransformer block
…Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[800…
wikiSinusoidal Positional Encoding
…Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[630…
wikiwhisper.cpp
…Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…
wikibeam search
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[450. Что такое…
answerЧто такое red teaming certification (стандарты 2026 для оценки robustness)?
…Метрики сертификации ### 3.1 ASR (Attack Success Rate) [[Вики/attack success rate\|ASR]] — доля успешных атак от общего числа попыток…
answerЧто такое Audio RAG (RAG для аудиофайлов)?
…Инструменты и библиотеки | Инструмент | Назначение | |------------|------------| | [[Вики/Whisper\|Whisper]] (openai/whisper) | ASR с таймстемпами | | [[Вики/Wav2Vec2\|Wav2Vec2]] (huggingface) | ASR для английского…
wikiCross-attention
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[365. Как работает…
wikiAdamW
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[469. Как работает…
answerКак делать adversarial evals для RAG (проверка на устойчивость)?
…Посчитать ASR и ΔFaith. ### Шаг 5: Анализ и улучшение - Типы атак с высоким ASR — приоритет для защиты. - Пример улучшений: увеличить…
answerКак тестировать robustness LLM к adversarial inputs?
…Оценка модели — прогнать чистые и атакованные примеры, измерить accuracy drop, ASR. 5. Анализ результатов — построить графики зависимости ASR от perturbation…
wikiattack success rate
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[364. Как вы…
wikiattention masking
…Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[651…
answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?
…вычислить ASR, refusal rate, false positive rate. 5. Анализ результатов: выделить категории с наибольшим ASR, сформулировать рекомендации для alignment. --- ## 5…
wikilow latency
# low latency ## Определение Метрика, характеризующая время отклика системы; в контексте ASR и voice-агентов означает минимальную задержку при обработке запроса…
wikiMultilingual audio
…Используется для обучения моделей ASR, таких как Whisper. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов|Индекс терминов…
answerЧто такое adversarial fine-tuning для защиты от jailbreak?
…Ключевая метрика успеха — снижение **[[Вики/attack success rate\|Attack Success Rate]] ([[Вики/attack success rate\|ASR]])** с ~80% до 5…
wikiGGUF
…Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…
wikicausal masking
…Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[440. Как работает…
answerКак работает rainbow teaming (комбинация red + blue + purple teaming для LLM)?
…Постройте график снижения ASR по итерациям. Ожидаемый результат: Вы увидите, как ASR падает от ~20-30% до <5% за 3…
wikiRiva
# Riva ## Определение Enterprise-решение от NVIDIA для real-time ASR/TTS с аппаратным ускорением, обеспечивающее низкую задержку. ## Где встречается - [[364…
wikiLiveKit
# LiveKit ## Определение Фреймворк для построения real-time voice агентов, включающий распознавание речи (ASR), LLM, синтез речи (TTS) и транспортный уровень…
wikiMOS
…Используется для оценки систем TTS и ASR. ## Где встречается - [[364. Как вы строите real-time voice agent с latency 500ms…
wikiFast-Conformer
# Fast-Conformer ## Определение Модель ASR от NVIDIA с латентностью около 100 мс, поддерживающая CTC и Transducer для распознавания речи в…
wikiEnd-to-end streaming
# End-to-end streaming ## Определение Архитектура real-time voice agent, где ASR, LLM и TTS работают в непрерывном потоке для…
answerЧто такое red teaming для LLM и как его проводить?
…Цикл повторяется, пока **success rate|Attack Success Rate (ASR)** не упадёт ниже заданного порога (например, 5%). Red teaming — ключевая практика…
wikiresidual connection
…Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[672…
answerКак работает Whisper (architecture, tokenization, training) для ASR?
…ASR (Automatic Speech Recognition) [[Вики/attack success rate\|ASR]] — [[Вики/Task\|задача]] преобразования речевого сигнала в текст. [[Вики/Whisper\|Whisper…
wikiCLAP
…текста и аудио, позволяющая выполнять поиск по звукам без ASR. ## Где встречается - [[546. Как вы индексируете видео-контент в RAG…
answerКак работает whisper.cpp для локального ASR с low latency?
…ASR (Automatic Speech Recognition) и low latency [[Вики/attack success rate\|ASR]] — технология преобразования речи в текст. В контексте AI…