Несбалансированные классы
Несбалансированные классы
Определение
Несбалансированные классы — это ситуация в задачах машинного обучения, когда количество примеров одного класса (частого) значительно превышает количество примеров другого класса (редкого). Из-за этого модель смещается в сторону частого класса, плохо распознавая редкие, что особенно критично, например, при модерации комментариев, где токсичные сообщения составляют меньшинство. Активное обучение помогает бороться с дисбалансом, целенаправленно добирая редкие примеры для разметки.