Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/standard deviation

standard deviation

standard deviation

Определение

Мера разброса значений относительно среднего. Используется для оценки стабильности метрик и настройки гиперпараметров.

Где встречается

  • 52. Настроить RWKV для инференса

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминdataevaluation

Ссылки

  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить RWKV для инференса

Обратные ссылки (23)

  • GRPO (Group Relative Policy Optimization) vs PPO — чем отличается и зачем нужен?
  • Индекс терминов
  • Как вы A/B тестируете две версии промпта в production?
  • Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику?
  • Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)?
  • Как вы проводите A/B тест метрик качества (не бизнес-метрик)?
  • Как защитить RAG от poisoning (вредоносные документы в базе знаний)?
  • Как работает LayerNorm и RMSNorm? В чем разница и почему RMSNorm быстрее?
  • Как работает RMSNorm (Root Mean Square Normalization) и чем лучше LayerNorm?
  • Как работает Whisper (architecture, tokenization, training) для ASR?
  • Как работает нормализация перед attention (pre-norm) vs после (post-norm)?
  • Почему в формуле attention нужно делить на √d_k? Что будет без масштабирования?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент с A/B тестированием
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить RWKV для инференса
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить self-training с псевдо-метками
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настройка мониторинга дрейфа метрик faithfulness и recall
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать market-based делегирование
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический rollback промпта при падении faithfulness
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить GPTQ vs AWQ на reasoning задачах
  • Что такое IRT (Item Response Theory) и как она применяется к LLM эвалюации?
  • Что такое statistical power evaluation и как определять размер выборки для A/B теста?
  • Что такое statistical power evaluation и как определять размер выборки?
  • Что такое watermarking для LLM генераций и как его детектировать?