EDA (Easy Data Augmentation)

EDA (Easy Data Augmentation)

Определение

EDA (Easy Data Augmentation) — набор простых операций аугментации текстовых данных, предложенный в статье Wei & Zou (2019). Включает четыре базовых приёма: Synonym Replacement (SR) — замена случайных слов на синонимы, Random Insertion (RI) — вставка случайного синонима в произвольную позицию, Random Swap (RS) — перестановка двух случайных слов местами, Random Deletion (RD) — удаление каждого слова с вероятностью p. Эти методы позволяют увеличить объём обучающей выборки и улучшить обобщающую способность моделей NLP без привлечения внешних ресурсов.

Где встречается

Навигация