English translation is not available yet. Showing Russian content.
dynamic benchmark
dynamic benchmark
Определение
Бенчмарк, который меняется со временем (например, автоматическая генерация новых вопросов) для уменьшения риска утечки тестовых данных (contamination).
Где встречается
- 488. Что такое benchmark contamination и как ее детектировать
- 689. Как вы проектируете dynamic benchmark (меняющийся со временем)
- 869. Как избежать benchmark contamination (когда модель видела тестовые данные)
- 800+ вопросов