Поиск

wikiHuman evaluation
# Human evaluation ## Определение Оценка качества результатов модели с привлечением людей-экспертов. Рекомендуется для критичных кейсов и является эталоном для проверки…
wikiHuman evaluation costs
# Human evaluation costs ## Определение Затраты на оплату аннотаторов для проведения human evaluation. Является дорогим, но необходимым компонентом оценки faithfulness и…
wikihuman-in-the-loop
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[493…
wikiKrippendorff's Alpha
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[800…
wikiGwet's AC1
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] ## Навигация…
wikiPercent agreement
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] ## Навигация…
answerКак работает мультимодальная эвалюация (MEGA, MM-Vet) для VL-моделей?
…Human evaluation vs Automatic evaluation | Критерий | Human Evaluation | Automatic Evaluation | |----------|------------------|----------------------| | Скорость | Медленно (часы/дни) | Быстро (секунды) | | Стоимость | Высокая (оплата аннотаторов…
wikiWeighted Kappa
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[277…
wikipairwise ranking loss
…подкреплением» (RLHF evaluation) и как она отличается от обычной]] - [[326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326…
wikiHumanEval
…Что такое meta-evaluation бенчмарков (оценка оценки)|498. Что такое meta-evaluation бенчмарков (оценка оценки)]] - [[596. Как работает model stealing…
wikilm_evaluation_harness
# lm_evaluation_harness ## Определение Библиотека для унифицированного запуска бенчмарков (GSM8K, MATH, HumanEval) на различных моделях. ## Где встречается - [[210. Сравнить GPTQ…
answerКак вы проверяете, что RLHF не сломал базовые способности модели?
…Периодическое тестирование во время RLHF Каждые N шагов (например, 100 шагов [[Вики/Proximal Policy Optimization\|PPO]]) повторяем [[Вики/Evaluation\|evaluation…
answerКак вы оцениваете качество после fine-tuning?
…Human evaluation (оценка человеком) [[Вики/human-in-the-loop\|Human evaluation]] — привлечение людей-аннотаторов для оценки качества ответов. Незаменима для…
wikiReinforcement Learning from Human Feedback
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[493…
answerКак вы измеряете и исправляете bias в LLM-as-Judge (self-enhancement, position, verbosity)?
…judge\|оценка LLM]] своих ответов минус средняя [[Вики/Evaluation\|оценка]] human. [[Вики/revision\|Исправление]] - Использовать анонимизацию (скрыть источник ответа). - Применять…
wikiPairwise comparison
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[486…
answerЧто такое meta-evaluation бенчмарков (оценка оценки)?
…robustness, fairness | Включает meta-evaluation через correlation с human judgment | | [[Вики/lm-evaluation-harness\|LM Evaluation Harness]] | Запуск бенчмарков с…
answerЧем отличается эвалюация LLM от эвалюации традиционных ML моделей?
…Поэтому оценка LLM требует evaluator-based подхода (LLM-as-judge, human evaluation), анализа трендов через эксперименты и не имеет автоматического…
wikiloguru
…Реализовать human-in-the-loop для критических действий|82. Реализовать human-in-the-loop для критических действий]] - [[86. Реализовать user…
wikiMM-Vet
# MM-Vet ## Определение Бенчмарк для мультимодальных VL-моделей с human evaluation по трём уровням: correctness, helpfulness, conciseness. ## Где встречается - [[560…
wikiAlpaca
…подкреплением» (RLHF evaluation) и как она отличается от обычной]] - [[326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326…
answerКак вы измеряете inter-rater reliability для human evaluation?
…Что такое statistical power evaluation и как определять размер выборки для AB теста\|491]] | Как вы проводите human evaluation для…
answerЧто такое synthetic eval collapse и как его предотвратить?
…Что такое meta-evaluation бенчмарков (оценка оценки)\|498]] | Human evaluation vs автоматические метрики | | [[499. Как вы оцениваете alignment модели с…
answerКак вы оцениваете faithfulness без ground truth (если нет правильного ответа)?
…Посчитайте корреляцию каждого метода с human judgement (Spearman). Ожидаемый результат - Таблица с точностью каждого метода относительно human evaluation. - Вывод о…
answerЧто такое benchmark chasing и почему это опасно?
…Human evaluation: как организовать **Gold standard** — это оценка человеком. Этапы: 1. Сбор репрезентативной выборки (100–500 запросов из production). 2…
wikiFleiss' Kappa
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[496…
wikiinter-rater reliability
# inter-rater reliability ## Определение Метрика согласованности между оценщиками при human evaluation, важная для получения надёжных качественных метрик при A/B…
wikiGPT-2
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[336…
wikiLikert scale
# Likert scale ## Определение Шкала для субъективной оценки качества ответов, например от 1 до 5, используемая в human evaluation. ## Где встречается…
answerКак проводить safety case для LLM системы (аналог safety case в авиации)?
…формулируется Claim (утверждение о безопасности), собирается Evidence (результаты [[Вики/red teaming\|red teaming]], метрики, [[Вики/Human evaluation\|human evaluation]], [[Вики…
answerЧто такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной?
…Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной? ## Краткий тезис [[Вики/Reinforcement Learning from Human…
answerЧто такое agent evaluation метрика: successful task completion rate vs step efficiency?
…Семантическая аннотация успеха — возможна автоматическая [[Вики/Check\|проверка]] (например, ответ содержит требуемые поля) или [[Вики/Human evaluation\|ручная разметка]] ([[Вики…
wikisafety alignment
…Как вы проектируете red teaming evaluation для jailbreak устойчивости|345. Как вы проектируете red teaming evaluation для jailbreak устойчивости]] - [[352…
answerЧто такое reward hacking в RLHF и как его детектировать?
…human evaluation и adversarial probing ### 5.1 Human evaluation на holdout-сете Самый надёжный способ — привлечь людей для оценки ответов…
answerЧто такое reward correlation и как ее измерять?
…Почему reward correlation критична для RLHF [[Вики/Reinforcement Learning from Human Feedback\|RLHF]] ([[Вики/Reinforcement Learning from Human Feedback\|Reinforcement…
wikiKL divergence
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[332…
answerКак детектировать reward hacking в RLHF?
…снижение разнообразия") ``` ### 3.3 Human evaluation на holdout Самый надёжный, но дорогой метод. На отложенном наборе примеров (не использованных для…
answerПочему LLM-as-Judge может быть biased? Назовите 3 основных bias и как их детектировать.
…Scale\|Масштабирование]]: [[Вики/human-in-the-loop\|ручная оценка]] ([[Вики/human-in-the-loop\|human evaluation]]) дорога и медленна. - Автоматизация…
wikiCohen's Kappa
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[495…
wikiuser satisfaction
…Что такое agent evaluation метрика successful task completion rate vs step efficiency]] - [[762. Что такое «эскалация человеку» (human escalation) и…
answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?
…Human Evaluation Автоматические метрики не идеальны. Некоторые атаки могут быть распознаны только человеком. [[Вики/human-in-the-loop\|Human evaluation…
answerКак вы проектируете бенчмарк для нового домена (медицина, юриспруденция)?
…Как вы измеряете inter-rater reliability для human evaluation\|492]] | Как проводить human evaluation для RAG? | | [[486. Почему LLM-as…
wikiConsensus
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[493…
answerЧто такое reward hacking в RLHF и как его детектировать?
…TruthfulQA, HellaSwag) после каждой эпохи RL. - [[Вики/human-in-the-loop\|Human evaluation]] — регулярная разметка сэмплов из текущей политики. **Формула…
wikiProximal Policy Optimization
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[328…
answerЧто такое meta-evaluation бенчмарков (оценка оценки)?
…1. [[Вики/Human evaluation\|Экспертная оценка]]: группа специалистов (лингвистов, психологов, ML-инженеров) анализирует каждое задание и определяет, какие когнитивные навыки…
answerЧто такое EU AI Act и как оно влияет на деплой LLM в production?
…5. **[[Вики/human-in-the-loop\|Human oversight]]** — возможность человека отменить или пересмотреть решение модели. 6. **[[Вики/accuracy\|Accuracy]], [[Вики…
wikiметаданные
…Как вы измеряете inter-rater reliability для human evaluation|492. Как вы измеряете inter-rater reliability для human evaluation]] - [[520…
wikiDirect Preference Optimization
…Как работает RLHF (Reinforcement Learning from Human Feedback) технически|326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически]] - [[330…
answerКак вы A/B тестируете две версии промпта в production?
…Как вы организуете human evaluation для LLM-систем\|139]] | Human evaluation как компонент A/B теста | --- ## 12. Навигация (Obsidian) - Предыдущий…