Goodhart's law
Goodhart's law
Определение
Принцип: когда метрика становится целью, она перестаёт быть хорошей мерой; объясняет reward hacking и переобучение на бенчмарк.
Где встречается
- 106. Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику
- 166. Назовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026).
- 344. Что такое reward hacking в RLHF и как его детектировать
- 489. Что такое reward hacking в RLHF и как его детектировать
- 498. Что такое meta-evaluation бенчмарков (оценка оценки)