Text augmentation
Text augmentation
Определение
Аугментация текста (Text augmentation) — это техника увеличения разнообразия обучающих данных путём применения различных преобразований к исходным текстам. Цель — улучшить обобщающую способность моделей машинного обучения и бороться с переобучением. Распространённые методы включают синонимическую замену, back-translation (обратный перевод), а также случайные вставки, удаления или замены слов.