Поиск
- wikiHuman evaluation
# Human evaluation ## Определение Оценка качества результатов модели с привлечением людей-экспертов. Рекомендуется для критичных кейсов и является эталоном для проверки…
- wikiHuman evaluation costs
# Human evaluation costs ## Определение Затраты на оплату аннотаторов для проведения human evaluation. Является дорогим, но необходимым компонентом оценки faithfulness и…
- wikihuman-in-the-loop
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[493…
- wikiKrippendorff's Alpha
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[800…
- wikiGwet's AC1
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] ## Навигация…
- wikiPercent agreement
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] ## Навигация…
- answerКак работает мультимодальная эвалюация (MEGA, MM-Vet) для VL-моделей?
…Human evaluation vs Automatic evaluation | Критерий | Human Evaluation | Automatic Evaluation | |----------|------------------|----------------------| | Скорость | Медленно (часы/дни) | Быстро (секунды) | | Стоимость | Высокая (оплата аннотаторов…
- wikiWeighted Kappa
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[277…
- wikipairwise ranking loss
…подкреплением» (RLHF evaluation) и как она отличается от обычной]] - [[326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326…
- wikiHumanEval
…Что такое meta-evaluation бенчмарков (оценка оценки)|498. Что такое meta-evaluation бенчмарков (оценка оценки)]] - [[596. Как работает model stealing…
- wikilm_evaluation_harness
# lm_evaluation_harness ## Определение Библиотека для унифицированного запуска бенчмарков (GSM8K, MATH, HumanEval) на различных моделях. ## Где встречается - [[210. Сравнить GPTQ…
- answerКак вы проверяете, что RLHF не сломал базовые способности модели?
…Периодическое тестирование во время RLHF Каждые N шагов (например, 100 шагов [[Вики/Proximal Policy Optimization\|PPO]]) повторяем [[Вики/Evaluation\|evaluation…
- answerКак вы оцениваете качество после fine-tuning?
…Human evaluation (оценка человеком) [[Вики/human-in-the-loop\|Human evaluation]] — привлечение людей-аннотаторов для оценки качества ответов. Незаменима для…
- wikiReinforcement Learning from Human Feedback
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[493…
- answerКак вы измеряете и исправляете bias в LLM-as-Judge (self-enhancement, position, verbosity)?
…judge\|оценка LLM]] своих ответов минус средняя [[Вики/Evaluation\|оценка]] human. [[Вики/revision\|Исправление]] - Использовать анонимизацию (скрыть источник ответа). - Применять…
- wikiPairwise comparison
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[486…
- answerЧто такое meta-evaluation бенчмарков (оценка оценки)?
…robustness, fairness | Включает meta-evaluation через correlation с human judgment | | [[Вики/lm-evaluation-harness\|LM Evaluation Harness]] | Запуск бенчмарков с…
- answerЧем отличается эвалюация LLM от эвалюации традиционных ML моделей?
…Поэтому оценка LLM требует evaluator-based подхода (LLM-as-judge, human evaluation), анализа трендов через эксперименты и не имеет автоматического…
- wikiloguru
…Реализовать human-in-the-loop для критических действий|82. Реализовать human-in-the-loop для критических действий]] - [[86. Реализовать user…
- wikiMM-Vet
# MM-Vet ## Определение Бенчмарк для мультимодальных VL-моделей с human evaluation по трём уровням: correctness, helpfulness, conciseness. ## Где встречается - [[560…
- wikiAlpaca
…подкреплением» (RLHF evaluation) и как она отличается от обычной]] - [[326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326…
- answerКак вы измеряете inter-rater reliability для human evaluation?
…Что такое statistical power evaluation и как определять размер выборки для AB теста\|491]] | Как вы проводите human evaluation для…
- answerЧто такое synthetic eval collapse и как его предотвратить?
…Что такое meta-evaluation бенчмарков (оценка оценки)\|498]] | Human evaluation vs автоматические метрики | | [[499. Как вы оцениваете alignment модели с…
- answerКак вы оцениваете faithfulness без ground truth (если нет правильного ответа)?
…Посчитайте корреляцию каждого метода с human judgement (Spearman). Ожидаемый результат - Таблица с точностью каждого метода относительно human evaluation. - Вывод о…
- answerЧто такое benchmark chasing и почему это опасно?
…Human evaluation: как организовать **Gold standard** — это оценка человеком. Этапы: 1. Сбор репрезентативной выборки (100–500 запросов из production). 2…
- wikiFleiss' Kappa
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[496…
- wikiinter-rater reliability
# inter-rater reliability ## Определение Метрика согласованности между оценщиками при human evaluation, важная для получения надёжных качественных метрик при A/B…
- wikiGPT-2
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[336…
- wikiLikert scale
# Likert scale ## Определение Шкала для субъективной оценки качества ответов, например от 1 до 5, используемая в human evaluation. ## Где встречается…
- answerКак проводить safety case для LLM системы (аналог safety case в авиации)?
…формулируется Claim (утверждение о безопасности), собирается Evidence (результаты [[Вики/red teaming\|red teaming]], метрики, [[Вики/Human evaluation\|human evaluation]], [[Вики…
- answerЧто такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной?
…Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной? ## Краткий тезис [[Вики/Reinforcement Learning from Human…
- answerЧто такое agent evaluation метрика: successful task completion rate vs step efficiency?
…Семантическая аннотация успеха — возможна автоматическая [[Вики/Check\|проверка]] (например, ответ содержит требуемые поля) или [[Вики/Human evaluation\|ручная разметка]] ([[Вики…
- wikisafety alignment
…Как вы проектируете red teaming evaluation для jailbreak устойчивости|345. Как вы проектируете red teaming evaluation для jailbreak устойчивости]] - [[352…
- answerЧто такое reward hacking в RLHF и как его детектировать?
…human evaluation и adversarial probing ### 5.1 Human evaluation на holdout-сете Самый надёжный способ — привлечь людей для оценки ответов…
- answerЧто такое reward correlation и как ее измерять?
…Почему reward correlation критична для RLHF [[Вики/Reinforcement Learning from Human Feedback\|RLHF]] ([[Вики/Reinforcement Learning from Human Feedback\|Reinforcement…
- wikiKL divergence
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[332…
- answerКак детектировать reward hacking в RLHF?
…снижение разнообразия") ``` ### 3.3 Human evaluation на holdout Самый надёжный, но дорогой метод. На отложенном наборе примеров (не использованных для…
- answerПочему LLM-as-Judge может быть biased? Назовите 3 основных bias и как их детектировать.
…Scale\|Масштабирование]]: [[Вики/human-in-the-loop\|ручная оценка]] ([[Вики/human-in-the-loop\|human evaluation]]) дорога и медленна. - Автоматизация…
- wikiCohen's Kappa
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[495…
- wikiuser satisfaction
…Что такое agent evaluation метрика successful task completion rate vs step efficiency]] - [[762. Что такое «эскалация человеку» (human escalation) и…
- answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?
…Human Evaluation Автоматические метрики не идеальны. Некоторые атаки могут быть распознаны только человеком. [[Вики/human-in-the-loop\|Human evaluation…
- answerКак вы проектируете бенчмарк для нового домена (медицина, юриспруденция)?
…Как вы измеряете inter-rater reliability для human evaluation\|492]] | Как проводить human evaluation для RAG? | | [[486. Почему LLM-as…
- wikiConsensus
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[493…
- answerЧто такое reward hacking в RLHF и как его детектировать?
…TruthfulQA, HellaSwag) после каждой эпохи RL. - [[Вики/human-in-the-loop\|Human evaluation]] — регулярная разметка сэмплов из текущей политики. **Формула…
- wikiProximal Policy Optimization
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[328…
- answerЧто такое meta-evaluation бенчмарков (оценка оценки)?
…1. [[Вики/Human evaluation\|Экспертная оценка]]: группа специалистов (лингвистов, психологов, ML-инженеров) анализирует каждое задание и определяет, какие когнитивные навыки…
- answerЧто такое EU AI Act и как оно влияет на деплой LLM в production?
…5. **[[Вики/human-in-the-loop\|Human oversight]]** — возможность человека отменить или пересмотреть решение модели. 6. **[[Вики/accuracy\|Accuracy]], [[Вики…
- wikiметаданные
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[520…
- wikiDirect Preference Optimization
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[330…
- answerКак вы A/B тестируете две версии промпта в production?
…Как вы организуете human evaluation для LLM-систем\|139]] | Human evaluation как компонент A/B теста | --- ## 12. Навигация (Obsidian) - Предыдущий…