Поиск
- answerЧто такое statistical power evaluation и как определять размер выборки?
…Что такое statistical power evaluation и как определять размер выборки? ## Краткий тезис Statistical power (power|статистическая мощность) — это вероятность обнаружить…
- wikistatistical power
# statistical power ## Определение Вероятность обнаружить реально существующий эффект в статистическом тесте (A/B-тесте), равная 1-β. Используется для определения…
- answerЧто такое statistical power evaluation и как определять размер выборки для A/B теста?
…Statistical Power (статистическая мощность) [[Вики/statistical power\|Statistical power]] ([[Вики/statistical power\|мощность]] теста]]) — это вероятность отвергнуть нулевую гипотезу, когда…
- answerКак делать A/B тестирование промптов в production?
…Изолируйте [[Вики/AB testing\|эксперимент]]. - Недостаточная [[Вики/statistical power\|статистическая мощность]] запуск на малой выборке ведёт к ложноотрицательным результатам. --- ## 8…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить A/B тестирование агентов
…Ключевой результат Статистически значимый ([[Вики/статистическая значимость\|p-value]] < 0.05) ответ на вопрос: «Улучшила ли [[Вики/candidate\|новая версия…
- answerКак вы A/B тестируете две версии промпта в production?
…t-test]] или [[Вики/bootstrap\|bootstrap]] с порогом [[Вики/статистическая значимость\|p-value]] < 0.05 для принятия решения о [[Вики…