dynamic benchmark
dynamic benchmark
Определение
Бенчмарк, который меняется со временем (например, автоматическая генерация новых вопросов) для уменьшения риска утечки тестовых данных (contamination).
Где встречается
- 488. Что такое benchmark contamination и как ее детектировать
- 689. Как вы проектируете dynamic benchmark (меняющийся со временем)
- 869. Как избежать benchmark contamination (когда модель видела тестовые данные)
- 800+ вопросов