Поиск

wikitop-k KL divergence loss
# top-k KL divergence loss ## Определение Функция потерь для обучения draft модели, минимизирующая расхождение только для top-k наиболее вероятных…
wikiKL divergence
# KL divergence ## Определение Мера различия между двумя вероятностными распределениями. Используется в RLHF для штрафа за отклонение от референсной модели и…
answerЧто такое KL divergence и где она применяется в LLM (RLHF, distillation)?
…Определение и формула KL divergence [[Вики/KL penalty\|KL divergence]] (также относительная [[Вики/Entropy\|энтропия]]) для дискретных распределений P и…
answerКак работает KL penalty в RLHF и как подобрать коэффициент?
…Зачем нужен KL penalty в RLHF? Без [[Вики/KL divergence\|KL penalty]] [[Вики/model\|модель]] может: - Переобучиться под [[Вики/reward…
wikiKL penalty
…Как работает KL penalty в RLHF и как подобрать коэффициент|332. Как работает KL penalty в RLHF и как подобрать…
wikiVAE
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
wikiTarget KL
# Target KL ## Определение Целевое значение KL divergence для adaptive KL penalty в RLHF, обычно 0.01–0.1 на токен…
answerЧто такое EAGLE-3 и чем он отличается от стандартного speculative decoding?
…EAGLE-2 добавил **динамическое построение дерева кандидатов**, а EAGLE-3 — **penalty|KL divergence penalty|KL divergence top-k penalty|KL…
wikiJensen-Shannon divergence
# Jensen-Shannon divergence ## Определение Симметричная и более устойчивая версия KL-дивергенции, используемая для сравнения распределений, например, при детекции data drift…
wikireward hacking
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать query drift детекцию
…Ключевой результат Рабочий компонент, который каждые N минут (настраиваемо) вычисляет статистическую меру расхождения ([[Вики/KL divergence\|KL divergence]] / [[Вики/Wasserstein…
wikiProximal Policy Optimization
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
answerКак вы отслеживаете data drift для распределения запросов к RAG?
…Статистические метрики сравнения распределений ### 4.1 KL-дивергенция (Kullback‑Leibler divergence) - Измеряет «потерю информации» при аппроксимации одного распределения другим. - Формула…
wikiEAGLE-3
# EAGLE-3 ## Определение Третья версия feature-aware speculative decoding, которая использует скрытые представления target модели и top-K KL divergence…
answerЧто такое reward hacking в RLHF и как его детектировать?
…Ключевые сигналы - Reward растёт, а downstream-метрики падают. - Reward растёт, но [[Вики/KL penalty\|KL divergence]] от SFT резко увеличивается…
answerЧем отличается эвалюация LLM от эвалюации традиционных ML моделей?
…Вместо статистических тестов распределений (penalty|KL divergence, PSI) здесь используются метрики faithfulness, answer relevance и согласованность. ## 1. Термины: эвалюация, LLM…
wikiPSI
# PSI ## Определение Метрика сравнения распределений, частный случай KL divergence; используется для обнаружения дрейфа данных в мониторинге ML-моделей (порог >0…
wikiSFT
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
wikiDirect Preference Optimization
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
wikiLLM distillation
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
answerКак детектировать reward hacking в RLHF?
…Инструменты и практические советы - [[Вики/Weights & Biases\|Weights & Biases]] — логируем reward, KL divergence, entropy, downstream метрики на каждом шаге. - Валидация…
answerЧто такое PPO (Proximal Policy Optimization) и почему он используется в RLHF?
…KL penalty и reference model В RLHF к reward добавляют [[Вики/KL penalty\|KL divergence penalty]]: $$ R_{total} = R_{reward…
wikireward model
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
wikiReinforcement Learning from Human Feedback
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
answerЧто такое calibration в контексте reward model для RLHF?
…Однако есть несколько причин, почему [[Вики/Calibration\|калибровка]] важна: - [[Вики/KL divergence\|KL penalty]] в [[Вики/Proximal Policy Optimization\|PPO…
answerЧто такое reward hacking в RLHF и как его детектировать?
…Как вы проектируете бенчмарк для нового домена (медицина, юриспруденция)\|490]] | KL divergence и её роль в RLHF | | [[491. Что такое…
answerКак вы отслеживаете data drift для распределения запросов к RAG?
…Основные методы включают сравнение распределений эмбеддингов запросов ([[Вики/KL divergence\|KL-дивергенция]], [[Вики/Wasserstein distance\|расстояние Вассерштейна]]), [[Вики/мониторинг\|мониторинг…
wikicross-entropy loss
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
answerКак вы проверяете, что RLHF не сломал базовые способности модели?
…PPO с KL-штрафом kl_penalty = beta * kl_divergence(ref_logits, policy_logits) reward = human_reward - kl_penalty ``` ### 5.2…
wikiTemperature
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)|657. Что такое KL divergence и где она…
answerКак работает model stealing attack (экстракция модели через API)?
…Обучите студента (gpt2 small) на этих данных с loss = KL divergence. 5. Оцените fidelity: средняя взаимная информация между распределениями на…
answerКак работает model stealing attack и как защититься?
…цикл обучения с loss = KL_divergence(student_logits, target_logits) ``` Важно в реальных условиях [[Вики/API\|API]] часто не возвращает…
answerGRPO (Group Relative Policy Optimization) vs PPO — чем отличается и зачем нужен?
…right) - \beta \cdot \text{KL}(\pi_\theta \| \pi_{\text{ref}}) \right) \right] \] Здесь $ \beta $ — коэффициент KL-регуляризации, \( \pi_{\text{ref…
answerКак вы мониторите дрейф данных (data drift) для RAG?
…Для этого используются статистические метрики расстояния ([[Вики/statistical distance\|statistical distance]]): - **[[Вики/KL divergence\|KL-дивергенция]] (Kullback–Leibler [[Вики/divergence…
answerЧто такое DPO (Direct Preference Optimization) и чем отличается от RLHF?
…penalty\|penalty]] за отклонение от исходной модели ([[Вики/KL divergence\|KL-дивергенция]]), чтобы не потерять способность к генерации осмысленных ответов…
answerКак вы измеряете drift retrieval-качества в RAG (когда документы меняются)?
…Дополнительно отслеживают [[Вики/Embedding drift\|дрейф эмбеддингов]] документов и запросов с помощью статистических тестов ([[Вики/PSI\|PSI]], [[Вики/KL divergence…
answerКак вы детектируете Distribution Collapse у агента?
…Дополнительные методы детекции | Метод | Суть | Когда полезен | |-------|------|---------------| | [[Вики/KL penalty\|KL‑divergence]] | Сравниваем распределение ответов агента с эталонным распределением (например…
answerКак вы проектируете агента, который может работать непрерывно (24/7) без дрейфа поведения?
…KL-дивергенция]] (Kullback–Leibler) — мера различия между текущим распределением действий и эталонным (например, за последнюю неделю). - [[Вики/Jensen-Shannon divergence…
answerКак работает кросс-энтропия (cross-entropy loss) для LLM обучения?
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)\|657]] - Индекс: [[00. Индекс разборов]]
answerКак работает perplexity и как ее интерпретировать? Связь с cross-entropy?
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)\|657]] - Следующий: [[659. Что такое Adam optimizer и…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать runbook для retrieval degradation
…из-за смены распределения запросов) | Включить проверку data drift (KL divergence эмбеддингов запросов); добавить примечание в runbook. | | Runbook устаревает при…
answerКак работает LayerNorm и RMSNorm? В чем разница и почему RMSNorm быстрее?
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)\|657]] | Архитектура Attention (Multi-Head, Grouped-Query) | | [[658…
answerКак вы делаете data quality monitoring для RAG корпуса?
…Stability Index]] ([[Вики/PSI\|PSI]])** или [[Вики/KL penalty\|Kullback-Leibler divergence]]. - Если [[Вики/drift\|дрейф]] превышает [[Вики/threshold\|порог…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать postmortem для retrieval degradation
…пользователей** | Постройте распределение эмбеддингов запросов для двух периодов, вычислите KL-divergence | Python, `scipy.stats.entropy` | | Зависимые сервисы | Проверьте логи на…
wikiИндекс терминов
…Вики/Kirsch-Mitzenmacker|Kirsch-Mitzenmacker]] - [[Вики/KL divergence|KL divergence]] - [[Вики/KL penalty|KL penalty]] - [[Вики/Knapsack problem|Knapsack problem…
question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)?** > _Ответ:_ KL(P||Q) = Σ P(x) log…
indexИндекс разборов
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)\|657. Что такое KL divergence и где она…
indexОглавление
…Что такое KL divergence и где она применяется в LLM (RLHF, distillation)\|657. Что такое KL divergence и где она…
indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…GPU / CUDA / Hardware (301-315) | Вопрос | Тема | Практические задачи (#) | |--------|------|------------------------| | 301 | Иерархия памяти GPU | Inf 206-216 | | 302 | Warp divergence | Inf…