Удержанный датасет

Удержанный датасет

Определение

Удержанный датасет (holdout dataset) — это часть данных, которая отделяется от обучающей выборки и не используется в процессе обучения модели. Он применяется для честной оценки производительности модели на невиденных данных (in‑distribution), чтобы избежать переобучения и получить объективную метрику качества. В контексте бенчмаркинга fine‑tuned моделей удержанный датасет является обязательным первым слоем оценки, обеспечивающим базовую проверку на примерах из того же распределения, что и обучение.

Где встречается

Навигация