Поиск
- wikireward correlation
# reward correlation ## Определение Проверка, насколько предсказания модели коррелируют с сигналом вознаграждения от человека ## Где встречается - [[496. Что такое reward correlation…
- answerЧто такое reward correlation и как ее измерять?
…Что такое reward correlation и как ее измерять? ## Краткий тезис [[Вики/reward correlation\|Reward correlation]] — это статистическая мера согласованности между…
- wikispurious correlations
# spurious correlations ## Определение Поверхностные признаки, которые модель использует для получения высокого proxy reward, что может приводить к reward hacking. ## Где…
- wikiSpearman correlation
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[498. Что такое…
- wikiPearson correlation
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[498. Что такое…
- wikiaccuracy предсказания winner
…Является метрикой качества reward model. ## Где встречается - [[496. Что такое reward correlation и как ее измерять|496. Что такое reward…
- wikiKendall's Tau
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] ## Навигация - [[00. Индекс…
- answerКак вы измеряете quality RLHF модели вне стандартных бенчмарков (MT-Bench)?
…Reward correlation (Spearman / Kendall) [[Вики/reward correlation\|Reward correlation]] — мера того, насколько хорошо обученная [[Вики/reward model\|reward model]] (RM…
- wikireward hacking
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[499. Как вы…
- wikiROC-AUC
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[602. Как работает…
- wikiExpected Calibration Error
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[872. Что такое…
- wikiInter-annotator agreement
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[499. Как вы…
- wikiProximal Policy Optimization
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[507. Что такое…
- answerЧто такое reward hacking в RLHF и как его детектировать?
…Обучите простую reward model на синтетических данных, где «хорошими» считаются ответы, содержащие слово «пожалуйста» (spurious correlation). 2. Обучите политику (SFT…
- wikireward model
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[507. Что такое…
- wikiDirect Preference Optimization
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[507. Что такое…
- wikiHoldout set
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[534. Как вы…
- wikiFleiss' Kappa
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[499. Как вы…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать process reward model (PRM)
…accuracy]] >80% . - PRM score correlation со значением верности финального ответа (корреляция Пирсона между средним reward шагов и binary correct). - [[Вики…
- wikiReinforcement Learning from Human Feedback
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[499. Как вы…
- wikiCalibration
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[498. Что такое…
- answerКак обучается reward model для RLHF и как избегать reward hacking?
…Как обучается reward model для RLHF и как избегать reward hacking? ## Краткий тезис **[[Вики/reward model\|Reward]] [[Вики/embedding-модель…
- wikiCohen's Kappa
…Что такое reward correlation и как ее измерять|496. Что такое reward correlation и как ее измерять]] - [[499. Как вы…
- answerЧто такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной?
…набор троек `([[Вики/промпт агента\|prompt]], chosen_response, rejected_response)`. ### 3.2 Обучение reward model - [[Вики/reward model\|Reward model…
- answerЧто такое meta-evaluation бенчмарков (оценка оценки)?
…Что такое reward correlation и как ее измерять\|496]] | Какие бенчмарки для оценки AI-агентов существуют? | | [[497. Как вы проектируете…
- answerКак вы измеряете и исправляете bias в LLM-as-Judge (self-enhancement, position, verbosity)?
…Рассчитать метрики: - **[[Вики/Mean Absolute Error\|Mean Absolute Error]] ([[Вики/Mean Absolute Error\|MAE]])** — среднее абсолютное отклонение. - [[Вики/Spearman correlation…
- answerЧто такое pairwise comparison vs scalar rating? Когда что использовать?
…Что такое reward correlation и как ее измерять\|496]] | Как бороться с bias в оценках пользователей? | --- ## 11. Навигация (Obsidian) - Предыдущий…
- answerКак вы проектируете red teaming evaluation для jailbreak устойчивости?
…Что такое reward correlation и как ее измерять\|496]] | Как вы проектируете evaluation pipeline для agentic RAG? | | [[498. Что такое…
- answerЧто такое synthetic eval collapse и как его предотвратить?
…Что такое reward correlation и как ее измерять\|496]] | Как бороться с contamination данных в eval? | | [[497. Как вы проектируете…
- wikiИндекс терминов
…Reward|Reward]] - [[Вики/reward correlation|reward correlation]] - [[Вики/reward delay|reward delay]] - [[Вики/reward hacking|reward hacking]] - [[Вики/reward model…
- answerКак вы измеряете inter-rater reliability для human evaluation?
…Что такое reward correlation и как ее измерять\|496]] | Как вы проводите A/B тестирование в RAG-системе? | | [[497. Как…
- answerЧто такое statistical power evaluation и как определять размер выборки для A/B теста?
…Что такое reward correlation и как ее измерять\|496]] | Power analysis для непараметрических тестов | ## 9. Навигация (Obsidian) - Предыдущий: [[490. Как…
- indexОглавление
…Что такое reward correlation и как ее измерять\|496. Что такое reward correlation и как ее измерять?]] - [[Вопросы/Ответы/497…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Что такое reward correlation и как ее измерять?** > _Ответ:_ Корреляция между reward model и human preferences. Метрики: > > - Spearman correlation (ранговая…
- indexИндекс разборов
…Что такое reward correlation и как ее измерять\|496. Что такое reward correlation и как ее измерять?]] - [[497. Как вы…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…latency p95 <2s, faithfulness >0.9 | Error budget | | 255 | Настроить correlation метрик | Граф зависимостей retrieval → generation latency | Найти корень | ## Категория…