Поиск

  • wikiStreaming ASR

    # Streaming ASR ## Определение Распознавание речи в реальном времени токен за токеном, используемое в voice-агентах для минимизации задержки. ## Где встречается…

  • wikiEncoder-decoder transformer

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…

  • wikiMultitask Learning

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…

  • wikiSpecAugment

    # SpecAugment ## Определение Метод аугментации данных для аудио, заключающийся в маскировании частотных и временных полос спектрограммы для улучшения обобщения моделей ASR

  • wikilog-Mel spectrogram

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…

  • wikiSuppress Tokens

    …Используется, например, для исключения неречевых токенов в ASR. ## Где встречается - [[363. Как работает Whisper (architecture, tokenization, training) для ASR|363…

  • wikiwav2vec 2.0

    # wav2vec 2.0 ## Определение ASR-модель от Meta на основе CNN и transformer encoder с self-supervised обучением и CTC…

  • wikireal-time factor

    # real-time factor ## Определение Метрика производительности ASR: отношение времени обработки аудио к его длительности; значение меньше 1 означает ускорение (например…

  • wikiHuBERT

    # HuBERT ## Определение Self-supervised аудио encoder на основе CNN и transformer, устойчивый к шуму, используется для ASR и обработки аудио…

  • wikiGELU

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[543. Как работает…

  • wikiDeepSpeech

    # DeepSpeech ## Определение ASR-модель на основе RNN (LSTM) и CTC, устаревшая, но лёгкая. Используется для streaming, но уступает по качеству…

  • answerКак вы строите real-time voice agent с latency <500ms?

    …kind = "audio" async def recv(self): # Получение аудиочанка от WebRTC frame = await super().recv() # Отправка в ASR asr_queue.put…

  • answerКак вы строите real-time voice agent с latency <500ms?

    …Основные компоненты: - [[Вики/Streaming ASR\|Streaming ASR]] — преобразует аудиопоток в текст по мере поступления. - [[Вики/LLM\|LLM]] — генерирует ответ, начиная…

  • answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?

    asr = evaluate_asr(model, attack_bank) print(f"Iteration {iteration}: ASR = {asr:.2%}") if asr < 0.05: break # Анализируем успешные…

  • wikiWhisperFeatureExtractor

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] ## Навигация - [[00. Индекс…

  • wikiWhisper

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[546. Как вы…

  • wikipiper.cpp

    …Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…

  • wikiWhisper streaming

    # Whisper streaming ## Определение Specific implementation of streaming ASR using OpenAI Whisper model. ## Где встречается - [[544. Как вы строите real-time…

  • wikiMel-спектрограмма

    …Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…

  • wikiMel-шкала

    …Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] ## Навигация…

  • wikiWord Error Rate

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[364. Как вы…

  • wikitransformer block

    …Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[800…

  • wikiSinusoidal Positional Encoding

    …Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[630…

  • wikiwhisper.cpp

    …Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…

  • wikibeam search

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[450. Что такое…

  • answerЧто такое red teaming certification (стандарты 2026 для оценки robustness)?

    …Метрики сертификации ### 3.1 ASR (Attack Success Rate) [[Вики/attack success rate\|ASR]] — доля успешных атак от общего числа попыток…

  • answerЧто такое Audio RAG (RAG для аудиофайлов)?

    …Инструменты и библиотеки | Инструмент | Назначение | |------------|------------| | [[Вики/Whisper\|Whisper]] (openai/whisper) | ASR с таймстемпами | | [[Вики/Wav2Vec2\|Wav2Vec2]] (huggingface) | ASR для английского…

  • wikiCross-attention

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[365. Как работает…

  • wikiAdamW

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[469. Как работает…

  • answerКак делать adversarial evals для RAG (проверка на устойчивость)?

    …Посчитать ASR и ΔFaith. ### Шаг 5: Анализ и улучшение - Типы атак с высоким ASR — приоритет для защиты. - Пример улучшений: увеличить…

  • answerКак тестировать robustness LLM к adversarial inputs?

    …Оценка модели — прогнать чистые и атакованные примеры, измерить accuracy drop, ASR. 5. Анализ результатов — построить графики зависимости ASR от perturbation…

  • wikiattack success rate

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[364. Как вы…

  • wikiattention masking

    …Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[651…

  • answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?

    …вычислить ASR, refusal rate, false positive rate. 5. Анализ результатов: выделить категории с наибольшим ASR, сформулировать рекомендации для alignment. --- ## 5…

  • wikilow latency

    # low latency ## Определение Метрика, характеризующая время отклика системы; в контексте ASR и voice-агентов означает минимальную задержку при обработке запроса…

  • wikiMultilingual audio

    …Используется для обучения моделей ASR, таких как Whisper. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов|Индекс терминов…

  • answerЧто такое adversarial fine-tuning для защиты от jailbreak?

    …Ключевая метрика успеха — снижение **[[Вики/attack success rate\|Attack Success Rate]] ([[Вики/attack success rate\|ASR]])** с ~80% до 5…

  • wikiGGUF

    …Как работает whisper.cpp для локального ASR с low latency|562. Как работает whisper.cpp для локального ASR с low…

  • wikicausal masking

    …Как работает Whisper (architecture, tokenization, training) для ASR|363. Как работает Whisper (architecture, tokenization, training) для ASR]] - [[440. Как работает…

  • answerКак работает rainbow teaming (комбинация red + blue + purple teaming для LLM)?

    …Постройте график снижения ASR по итерациям. Ожидаемый результат: Вы увидите, как ASR падает от ~20-30% до <5% за 3…

  • wikiRiva

    # Riva ## Определение Enterprise-решение от NVIDIA для real-time ASR/TTS с аппаратным ускорением, обеспечивающее низкую задержку. ## Где встречается - [[364…

  • wikiLiveKit

    # LiveKit ## Определение Фреймворк для построения real-time voice агентов, включающий распознавание речи (ASR), LLM, синтез речи (TTS) и транспортный уровень…

  • wikiMOS

    …Используется для оценки систем TTS и ASR. ## Где встречается - [[364. Как вы строите real-time voice agent с latency 500ms…

  • wikiFast-Conformer

    # Fast-Conformer ## Определение Модель ASR от NVIDIA с латентностью около 100 мс, поддерживающая CTC и Transducer для распознавания речи в…

  • wikiEnd-to-end streaming

    # End-to-end streaming ## Определение Архитектура real-time voice agent, где ASR, LLM и TTS работают в непрерывном потоке для…

  • answerЧто такое red teaming для LLM и как его проводить?

    …Цикл повторяется, пока **success rate|Attack Success Rate (ASR)** не упадёт ниже заданного порога (например, 5%). Red teaming — ключевая практика…

  • wikiresidual connection

    …Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)|543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)]] - [[672…

  • answerКак работает Whisper (architecture, tokenization, training) для ASR?

    ASR (Automatic Speech Recognition) [[Вики/attack success rate\|ASR]] — [[Вики/Task\|задача]] преобразования речевого сигнала в текст. [[Вики/Whisper\|Whisper…

  • wikiCLAP

    …текста и аудио, позволяющая выполнять поиск по звукам без ASR. ## Где встречается - [[546. Как вы индексируете видео-контент в RAG…

  • answerКак работает whisper.cpp для локального ASR с low latency?

    ASR (Automatic Speech Recognition) и low latency [[Вики/attack success rate\|ASR]] — технология преобразования речи в текст. В контексте AI…