Balancing Datasets

Balancing Datasets

Определение

Balancing Datasets — это процесс устранения дисбаланса классов в наборе данных, когда один из классов представлен значительно большим количеством примеров, чем другие. Цель балансировки — предотвратить смещение модели в сторону доминирующего класса и повысить её способность корректно классифицировать редкие, но важные случаи. Основные методы включают undersampling (уменьшение числа примеров мажоритарного класса), oversampling (увеличение числа примеров миноритарного класса) и генерацию синтетических данных.

Где встречается

Навигация