downstream metrics
downstream metrics
Определение
Метрики на целевых задачах, используемые для оценки качества модели; их падение при росте proxy reward сигнализирует о reward hacking.
Где встречается
- 259. Как вы генерируете synthetic данные для instruction tuning
- 375. Как вы калибруете retrieval confidence для threshold-based filtering
- 489. Что такое reward hacking в RLHF и как его детектировать
- 873. Как детектировать reward hacking в RLHF
- 800+ вопросов